A gépi tanulás lényege a meglévő adatokból új információkhoz jutni.
Wikipedia magyarázat:
“A gépi tanulás a Mesterséges Intelligencia (MI) egyik ága, olyan rendszerekkel foglalkoznak, melyek tanulni képesek, azaz tapasztalatokból tudást generálnak. A gyakorlatban ez azt jelenti, hogy a rendszer példa adatok, minták alapján képes önállóan, vagy emberi segítséggel szabályszerűségeket/szabályokat felismerni/meghatározni. A rendszer tehát nem csupán betanulja „kívülről” mintákat, hanem képes ezek alapján olyan általánosításra, ami alapján – a tanulási szakasz végeztével – ismeretlen adatokra vonatkozólag is „helyes” döntéseket tud hozni.”
Alkalmazási területek
Több különböző terület van, ahol lehet használni ilyen algoritmusokat. Ezek közül mutatom be azokat, amelyeket először érdemes megismerni.
Ezek közül az első 2 az úgynevezett „Felügyelt gépi tanulás”-i algoritmusok közé tartozik, aminek a lényege, hogy van egy betanításra használt adattömeg ami alapján az algoritmus elkészíti azt a modellt, amit fog tudni használni az új adatok értékelésekor.
Klasszifikáció (Classification)
egy egyed besorolása valamilyen szempont szerint. Például az alábbi kérdések megválaszolására lehet alkalmas:
- Az új ügyfél várhatóan fog-e venni egy bizonyos terméket?
- Egy beteg 6 hónapon belül vissza kerül-e a kórházba egy kezelés után?
- A repülőjárat 15 percnél többet késik?
- A melyik szám szerepel a kézzel írt papírlapon 0-9-ig?
Mint látható klasszifikációs technikák nem csak igaz-hamis állítások eldöntésére alkalmazhatóak, hanem minden olyan területen, ahol véges számú diszkrét érték közül kell választani.
Regresszió (Regression)
Egy folytonos érték meghatározása. Például az alábbi kérdések megválaszolására lehet alkalmas:
- Mekkora bevétel várható az új ügyfélről?
- Várhatóan hány percet fog késni a repülőjárat?
- Mekkora lesz az átlagos vérnyomás a kezelés után?
Klaszterezés (Clustering)
Kiválasztott tulajdonságok alapján csoportokba sorolja az egyedeket.
- Homogén ügyfél csoportok kialakítása ügyfél-kiszolgálási modell készítéséhez
- Kirívó esetek megtalálása
Ez a felhasználási mód nem új egyedek egy tulajdonságának, értékének a meghatározására való hanem a meglévő egyedek csoportosítására való. Ez az úgynevezett „Nem felügyelt gépi tanulás”-i algoritmusok közé tartozik. Nincs szüksége az algoritmusnak egy betanításra használt adattömegre.
Gépi tanulási modellek
Logisztikus regresszió
Ez a modell kizárólag klasszifikációnál használható. A célja egy olyan görbe megrajzolása, ami a különböző kategóriákat a lehető legpontosabban elválasztja.
Viszont, mint minden modellnél ennél is figyelni kell, hogy az előálló egyenlet ne legyen túlságosan a tréning adatokra illesztve, mert ez a későbbiekben új adatok kiértékelésekor téves eredményt hozhat.

A képen a fekete görbe jelzi a megfelelő illesztést és a zöld az úgynevezett „Over-fitted” modellt.
bővebben: https://en.wikipedia.org/wiki/Logistic_regression
Döntési fák
Ez a típus talán a legismertebb és nem csak gépi tanulási modellekben használt módszer.
A lényege, hogy a magyarázó változókból létrehozunk egy olyan döntési fát, ami a tréning adatokból a legnagyobb arányban a helyes választ adja meg.
A döntési fák véges számú különböző végeredményt tudnak generálni.

Jellemző technika, hogy nem egy nagyon részletes és ezért nagyon pontos fát készítenek, hanem nagyon sok kevésbé részletes fát, aminek klasszifikáció esetén a „többségi szavazatát” vagy regresszió esetén a súlyozott átlagát veszik. Lásd: https://en.wikipedia.org/wiki/Gradient_boosting
bővebben: https://en.wikipedia.org/wiki/Decision_tree
Neurális hálózat
A Neurális hálózatok az emberi ideghálózat működését próbálják szimulálni. A működési elve hogy egy több szintű hálózaton a „neuronok” a bemenő adatok alapján a bennük lévő képlet eredményekénk vagy „elsülnek” vagy nem. A hálózaton ezek a jelek haladnak végig amíg elérnek a kimeneti réteghez.

Itt egy úgynevezett „Back propagation” módszerre az előállt végeredménytől vissza felé javítják a „neuronok” válaszait, hogy helyesebb végeredményt produkáljanak. Lásd: https://en.wikipedia.org/wiki/Backpropagation
bővebben: https://en.wikipedia.org/wiki/Artificial_neural_network
A következő gépi tanulással foglalkozó blog posztunkban a gyakorlati példán keresztül mutatjuk be ezeknek a modelleknek a használatát és eredményét.
Amennyiben pedig továbblépnél és szeretnéd ezekből a lehetőségekből a mindennapi munkában minél többet hasznosítani, keress fel minket az elérhetőségeink valamelyikén, és mi segítünk megtalálni azokat a területeket, ahol a legnagyobb üzleti hasznot realizálhatod egy ilyen eszköz használatával, természetesen szakmai támogatást nyújtunk a bevezetéshez