Melyik gépi tanulási algoritmust válasszuk?
Adatkészletének mérete
Az algoritmusok nagyon érzékenyek az adatkészlet méretére. Bár nincsenek abszolút szabályok, amelyek megszabják, hogy melyik algoritmust kell használni az 50 MB-nál kisebb vagy 1 TB-nál nagyobb adatkészleteknél, itt vannak azok az algoritmusok, amelyekkel érdemes kezdenie, tekintettel az Ön rendelkezésére álló adatmennyiségre feltételezve, hogy a mintaadatkészlet kiegyensúlyozott.
Tanulási sebesség
A tanulási sebesség az, hogy mennyi ideig tart az új modell felépítése és betanítása egy adott számítási erőforráshoz. Az olyan tényezők, mint az algoritmus architektúrája és a bonyolultság (többek között) befolyásolják a modell betanításának sebességét. Az alábbi algoritmusokat veheti számításba, ha a projektje nagyon érzékeny a képzési sebességre, és nincs gyorsító hardvere.
Értelmezhetőség
A gépi tanulási modellek lehetnek nem intuitívak és nehezen érthetők. Az értelmezhetőség arra utal, hogy mennyire átlátható az algoritmus döntéshozatali folyamata. Az értelmezhetőség azonban gyakran az erő és a pontosság rovására megy. Különböző iparágaknak és alkalmazásoknak sajátos követelményei is lehetnek az értelmezhetőség tekintetében. A választáshoz íme néhány alapvető értékelés arról, hogy mennyire könnyű vagy nehéz értelmezni az algoritmusokat.
Hangolás
A hangolás az, amikor optimalizálja egy adott modell paramétereit vagy hiperparamétereit, hogy megtalálja a legjobb eredményt a modell számára. Egyes algoritmusok nem igényelnek hangolást, és korlátozzák a módosítható paraméterek vagy hiperparaméterek számát. Miután kiválasztott egy adott modelltípust a betanításra, a modell optimalizálása érdekében automatikusan módosíthatja a teljesítményét erősen befolyásoló paramétereket. Mennyi hangolást szeretne elvégezni?