Методе ансамбла - Преглед, Категорије, Главни типови

Методе ансамбла су технике којима је циљ побољшање тачности резултата у моделима комбиновањем више модела уместо да се користи један модел. Комбиновани модели значајно повећавају тачност резултата. Ово је повећало популарност ансамбл метода у машинском учењу.

Методе ансамбла

Кратак сажетак

  • Методе ансамбла имају за циљ побољшање предвидљивости у моделима комбиновањем неколико модела у један врло поуздан модел.
  • Најпопуларније методе ансамбла су појачавање, стављање у вреће и слагање.
  • Методе ансамбла идеалне су за регресију и класификацију, где смањују пристрасност и варијансе да би се повећала тачност модела.

Категорије ансамбл метода

Ансамбл методе спадају у две широке категорије, тј. Секвенцијалне ансамбл технике и технике паралелног ансамбла. Технике секвенцијалног ансамбла генеришу основне ученике у низу, нпр. Адаптиве Боостинг (АдаБоост). Секвенцијално генерисање основних ученика промовише зависност између основних ученика. Учинак модела се затим побољшава додељивањем већих пондера претходно погрешно представљеним ученицима.

У технике паралелног ансамбла, основни ученици се генеришу у паралелном формату, нпр. случајна шума Случајна шума Случајна шума је техника која се користи за моделирање предвиђања и анализе понашања и гради се на стаблима одлука. Случајна шума садржи мноштво стабала одлучивања. Паралелне методе користе паралелно генерисање основних ученика како би подстакле независност између основних ученика. Независност основних ученика значајно смањује грешку због примене просека.

Већина ансамбл техника примењује један алгоритам у основном учењу, што резултира хомогеношћу код свих основних ученика. Хомогени основни ученици се односе на основне ученике исте врсте, са сличним квалитетима. Друге методе примењују хетерогене основне ученике, стварајући хетерогене целине. Ученици хетерогене базе су ученици различитих врста.

Главне врсте ансамбл метода

1. Вреће

Вреће, кратки облик за агрегацију боотстрапа, углавном се примењује у класификацији и регресионој анализи регресије Регресијска анализа је скуп статистичких метода који се користе за процену односа између зависне променљиве и једне или више независних променљивих. Може се користити за процену снаге односа између променљивих и за моделирање будућег односа између њих. . Повећава тачност модела употребом стабала одлучивања, што у великој мери смањује варијансу. Смањење варијансе повећава тачност, а тиме и елиминисање прекомерне опреме, што је изазов за многе предиктивне моделе.

Вреће се класификује у две врсте, тј. Боотстраппинг и агрегација. Боотстраппинг је техника узорковања где се узорци изводе из целе популације (скупа) применом поступка замене. Узорковање методом замене помаже да се поступак одабира рандомизира. Основни алгоритам учења се покреће на узорцима да би се довршио поступак.

Агрегација у врећама се врши да би се укључили сви могући исходи предвиђања и случајни исход. Без агрегирања, предвиђања неће бити тачна, јер се сви исходи не узимају у обзир. Стога се агрегација заснива на поступцима за покретање вјероватноће или на основу свих исхода предиктивних модела.

Полагање вреће је повољно јер се ученици слабе базе комбинују у једног јаког ученика који је стабилнији од појединачног ученика. Такође елиминише било какве разлике, а самим тим смањује прекомерно прилагођавање модела. Једно ограничење вреће је да је рачунски скупо. Дакле, то може довести до више пристрасности у моделима када се занемари одговарајући поступак врећања.

2. Појачавање

Појачавање је ансамбл техника која учи на претходним грешкама предиктора да би направила боља предвиђања у будућности. Техника комбинује неколико ученика слабе базе да би се формирао један јак ученик, што значајно побољшава предвидљивост модела. Појачавање делује слагањем слабих ученика у низ, тако да слаби ученици уче од следећег ученика у низу како би створили боље предиктивне моделе.

Појачавање има много облика, што укључује појачавање градијента, прилагодљиво појачавање (АдаБоост) и КСГБоост (екстремно појачавање градијента). АдаБоост користи слабе ученике који су у облику стабала одлучивања, која углавном укључују једну поделу која је у народу позната као пањеви одлучивања. Главни пад АдаБооста састоји се од запажања која имају сличне тежине.

Градиент боостинг Градиент Боостинг Градиент Боостинг је техника која се користи у стварању модела за предвиђање. Техника се највише користи у поступцима регресије и класификације. додаје предикторе узастопно у ансамбл, где претходни предиктори исправљају своје наследнике, повећавајући тиме тачност модела. Нови предиктори су способни да се супротставе ефектима грешака у претходним предикторима. Градијент спуштања помаже појачавању градијента у идентификовању проблема у предвиђањима ученика и њиховом супротстављању.

КСГБоост користи стабла одлучивања са појачаним нагибом, пружајући побољшану брзину и перформансе. У великој мери се ослања на рачунску брзину и перформансе циљног модела. Обука за моделе треба да следи редослед, што успорава примену машина са појачаним нагибом.

3. Слагање

Слагање, друга метода ансамбла, често се назива сложеним уопштавањем. Ова техника делује тако што омогућава алгоритму тренинга да састави неколико других сличних предвиђања алгоритма учења. Слагање је успешно примењено у регресији, процени густине, учењу на даљину и класификацијама. Такође се може користити за мерење стопе грешке током вреће.

Смањење варијансе

Методе ансамбла идеалне су за смањење варијансе у моделима, а самим тим и повећање тачности предвиђања. Варијанса се елиминише када се више модела комбинује да би се формирало једно предвиђање које је изабрано из свих осталих могућих предвиђања из комбинованих модела. Ансамбл модела је чин комбиновања различитих модела како би се осигурало да резултујуће предвиђање буде најбоље могуће, на основу разматрања свих предвиђања.

Додатна средства

Финанце је званични добављач глобалног сертификованог банкарског и кредитног аналитичара (ЦБЦА) ™ ЦБЦА ™ сертификација Акредитација сертификованог банкарског и кредитног аналитичара (ЦБЦА) ™ је глобални стандард за кредитне аналитичаре који покрива финансије, рачуноводство, кредитну анализу, анализу новчаног тока , моделирање савеза, отплата кредита и још много тога. програм сертификације, осмишљен да помогне свима да постану финансијски аналитичари светске класе. Да бисте наставили напредовати у каријери, корисни ће вам бити додатни финансијски ресурси у наставку:

  • Еластична мрежа Еластична мрежа Еластична мрежа линеарно користи казне из технике ласо и гребена како би регулисала моделе регресије. Техника комбинује и ласо и
  • Оверфиттинг Оверфиттинг Оверфиттинг је термин који се користи у статистици који се односи на грешку у моделирању која се јавља када функција преуско одговара одређеном скупу података
  • Скалабилност Скалабилност Скалабилност може пасти и у контексту финансијске и пословне стратегије. У оба случаја то значи способност ентитета да издржи притисак од
  • Споофинг Споофинг Споофинг је ометајућа алгоритамска пракса трговања која укључује давање понуда за куповину или понуда за продају фјучерс уговора и поништавање понуда или понуда пре извршења посла. Пракса намерава да створи лажну слику потражње или лажног песимизма на тржишту.

Рецент Постс

$config[zx-auto] not found$config[zx-overlay] not found