Отпремање врећа (Боотстрап агрегација) - преглед, како то функционише, предности

Машинско учење у ансамблу може се углавном сврстати у вреће и појачање. Техника врећања корисна је и за регресију и за статистичку класификацију. Вреће се користи са стаблима одлука, где значајно подиже стабилност модела у смањењу варијансе и побољшању тачности, што елиминише изазов прекомерне опреме.

Баггинг

Слика 1. Проток вреће (Боотстрап Аггрегатион). Извор

Прикључивање машинског учења у ансамблу узима неколико слабих модела, обједињујући предвиђања да би се изабрало најбоље предвиђање. Слаби модели су се специјализовали за различите одељке простора карактеристика, што омогућава предвиђање преноса полуге из сваког модела да би постигли крајњу сврху.

Брзо Суммари

  • Убацивање у врећу и појачавање су две главне методе машинског учења у ансамблу.
  • Врећање је ансамбл метода која се може користити у регресији и класификацији.
  • Такође је познато и као агрегација боотстрапа, која чини две класификације врећа.

Шта је Боотстраппинг?

Вреће се састоји из два дела: агрегације и боотстраппинга. Боотстраппинг је метода узорковања, где се узорак бира из скупа, применом методе замене. Алгоритам учења се затим покреће на одабраним узорцима.

Техника боотстраппинг користи узорковање са заменама како би поступак одабира био потпуно случајан. Када се узорак одабере без замене, следећи одабир променљивих увек зависи од претходних избора, па критеријуми постају не случајни.

Шта је агрегација?

Предвиђања модела подвргавају се агрегацији да би се комбинирала у коначном предвиђању како би се размотрили сви исходи могући. Агрегација се може извршити на основу укупног броја исхода или на основу вероватноће предвиђања изведених из покретања сваког модела у процедури.

Шта је метода ансамбла?

И паковање и појачавање чине најистакнутије технике ансамбла. Метода ансамбла је платформа за машинско учење која помаже више модела у тренингу коришћењем истог алгоритма учења. Ансамбл метода је учесник веће групе мулти-класификатора.

Мулти-класификатори су група вишеструког ученика који наилази на хиљаде, са заједничким циљем који може спојити и решити заједнички проблем. Друга категорија мулти-класификатора су хибридне методе. Хибридне методе користе скуп ученика, али за разлику од мулти-класификатора, могу користити различите методе учења.

Учење се суочава са вишеструким изазовима, попут грешака које су углавном последица пристрасности, шума и варијансе. Тачност и стабилност машинског учења загарантоване су ансамбл методама као што су вреће и појачавање. Више комбинација класификатора смањује одступање, посебно тамо где су класификатори нестабилни и важни су за представљање поузданијих резултата од појединачног класификатора.

Примена било паковања или појачања захтева прво избор основног алгоритма за ученике. На пример, ако се изабере стабло класификације, појачавање и пуњење у вреће било би скуп дрвећа величине једнаке жељи корисника.

Предности и недостаци вреће

Случајна шума Случајна шума Случајна шума је техника која се користи за моделирање предвиђања и анализе понашања и изграђена је на стаблима одлука. Случајна шума садржи мноштво стабала одлучивања један је од најпопуларнијих алгоритама за вреће. Торбарење нуди предност омогућавања многим слабим ученицима да удруже напоре да надмаше једног јединог јаког ученика. Такође помаже у смањењу одступања, отуда елиминишући прекомерно уклапање Прекомерно уклапање је термин који се користи у статистици и односи се на грешку у моделирању која се јавља када функција преуско одговара одређеном скупу података о моделима у процедури.

Један недостатак торби је што доводи до губитка интерпретабилности модела. Резултатни модел може имати пуно пристраности када се занемари одговарајући поступак. Иако је паковање изузетно прецизно, рачунски може бити скупо и то може обесхрабрити његову употребу у одређеним случајевима.

Багинг наспрам појачавања

Најбоља техника коју треба користити између спаковања и појачања зависи од доступних података, симулације и свих постојећих околности у то време. Варијанса процене се значајно смањује техникама пуњења и појачавања током поступка комбиновања, чиме се повећава тачност. Стога добијени резултати показују већу стабилност од појединачних резултата.

Када догађај представља изазов слабих перформанси, техника врећа неће резултирати бољом пристрасношћу. Међутим, техника појачавања генерише јединствени модел са нижим грешкама, јер се концентрише на оптимизацију предности и смањење недостатака у једном моделу.

Када је изазов у ​​једном моделу прекомерно прилагођен, метода врећања има боље резултате од технике појачавања. Појачавање се суочава са изазовом руковања прекомерним уклапањем, јер долази са прекомерним уклапањем само по себи.

Сродна читања

Финанце нуди Финансијско моделирање и вредновање аналитичара (ФМВА) ™ ФМВА® сертификат Придружите се 350.600+ ученика који раде у компанијама попут Амазона, ЈП Моргана и Феррари сертификационог програма за оне који желе да своју каријеру подигну на виши ниво. Да бисте наставили да учите и развијате своју базу знања, истражите додатне релевантне финансијске ресурсе у наставку:

  • Узорковање кластера Узорковање кластера У статистикама, кластер узорковање је метода узорковања у којој је целокупна популација студије подељена на споља хомогене, али интерно
  • Предрасуде прекомерног самопоуздања Прекомерно самопоуздање пристрасност је лажна и обмањујућа оцена наших вештина, интелекта или талента. Укратко, егоистично је веровање да смо бољи него што заправо јесмо. То може бити опасна пристрасност и врло је плодно у финансирању понашања и тржиштима капитала.
  • Регресијска анализа Регресијска анализа Регресијска анализа је скуп статистичких метода који се користе за процену односа између зависне променљиве и једне или више независних променљивих. Може се користити за процену снаге односа између променљивих и за моделирање будућег односа између њих.
  • Анализа података временских серија Анализа података временских серија Анализа података временских серија је анализа скупова података који се мењају током одређеног временског периода. Скупови података временских серија бележе запажања исте променљиве током различитих временских тачака. Финансијски аналитичари користе податке из временских серија, попут кретања цена акција или продаје компаније током времена

Рецент Постс

$config[zx-auto] not found$config[zx-overlay] not found