Uzraudzīta, neuzraudzīta un pastiprināta mācīšanās ir trīs atšķirīgas pieejas mašīnmācības jomā. Katra pieeja izmanto dažādas metodes un algoritmus, lai risinātu dažāda veida problēmas un sasniegtu konkrētus mērķus. Izpētīsim atšķirības starp šīm pieejām un sniegsim visaptverošu skaidrojumu par to īpašībām un pielietojumiem.
Uzraudzītā mācīšanās ir mašīnmācīšanās veids, kurā algoritms mācās no iezīmētiem datiem. Apzīmētie dati sastāv no ievades piemēriem, kas savienoti pārī ar atbilstošo pareizo izvades vai mērķa vērtību. Uzraudzītās mācīšanās mērķis ir apmācīt modeli, kas var precīzi paredzēt jaunu, neredzētu ievadi. Mācību algoritms izmanto marķētos datus, lai secinātu modeļus un attiecības starp ievades līdzekļiem un izvades etiķetēm. Pēc tam tas vispārina šīs zināšanas, lai prognozētu jaunus, nemarķētus datus. Uzraudzīta mācīšanās parasti tiek izmantota tādos uzdevumos kā klasifikācija un regresija.
Piemēram, klasifikācijas uzdevumā algoritms tiek apmācīts datu kopā, kurā katrs datu punkts ir apzīmēts ar noteiktu klasi. Algoritms iemācās klasificēt jaunus, neredzētus datu punktus vienā no iepriekš definētajām klasēm, pamatojoties uz modeļiem, kas iegūti no marķētajiem piemēriem. Regresijas uzdevumā algoritms mācās paredzēt nepārtrauktu skaitlisko vērtību, pamatojoties uz ievades pazīmēm.
No otras puses, neuzraudzīta mācīšanās attiecas uz nemarķētiem datiem. Nepārraudzītas mācīšanās mērķis ir atklāt slēptos modeļus, struktūras vai attiecības datos bez jebkādām priekšzināšanām par izvades etiķetēm. Atšķirībā no uzraudzītas mācīšanās, neuzraudzītas mācīšanās algoritmiem nav skaidru mērķa vērtību, kas vadītu mācību procesu. Tā vietā viņi koncentrējas uz nozīmīgu attēlojumu vai kopu atrašanu datos. Nepārraudzīta mācīšanās parasti tiek izmantota tādos uzdevumos kā klasterizācija, dimensiju samazināšana un anomāliju noteikšana.
Klasterizācija ir populāra neuzraudzītas mācīšanās lietojumprogramma, kurā algoritms grupē līdzīgus datu punktus, pamatojoties uz to raksturīgajām īpašībām. Piemēram, klientu segmentācijā var izmantot nepārraudzītu mācību algoritmu, lai identificētu atsevišķas klientu grupas, pamatojoties uz viņu pirkšanas paradumiem vai demogrāfisko informāciju.
Pastiprināšanas mācīšanās ir atšķirīga paradigma, kurā aģents mācās mijiedarboties ar vidi, lai maksimāli palielinātu kumulatīvo atlīdzības signālu. Pastiprināšanas mācībās algoritms mācās, izmantojot izmēģinājumu un kļūdu procesu, veicot darbības, novērojot vides stāvokli un saņemot atgriezenisko saiti atlīdzības vai sodu veidā. Mērķis ir atrast optimālu politiku vai darbību kopumu, kas maksimāli palielinātu ilgtermiņa atlīdzību. Mācību pastiprināšana parasti tiek izmantota tādos uzdevumos kā spēļu spēlēšana, robotika un autonomās sistēmas.
Piemēram, šaha spēlē pastiprināšanas mācību aģents var iemācīties spēlēt, izpētot dažādas kustības, saņemot atlīdzību vai sodus, pamatojoties uz katra gājiena iznākumu, un pielāgojot savu stratēģiju, lai palielinātu izredzes uzvarēt.
Uzraudzītā mācīšanās izmanto marķētus datus, lai apmācītu modeli prognozēšanas uzdevumiem, bez uzraudzības mācīšanās atklāj modeļus un struktūras nemarķētos datos, un pastiprināšanas mācīšanās mācās, mijiedarbojoties ar vidi, lai maksimāli palielinātu atalgojuma signālu. Katrai pieejai ir savas stiprās un vājās puses, un tā ir piemērota dažāda veida problēmām un lietojumiem.
Citi jaunākie jautājumi un atbildes par EITC/AI/GCML Google Cloud Machine Learning:
- Kas ir teksts runāšanai (TTS) un kā tas darbojas ar AI?
- Kādi ir ierobežojumi darbam ar lielām datu kopām mašīnmācībā?
- Vai mašīnmācība var sniegt dialogu?
- Kas ir TensorFlow rotaļu laukums?
- Ko patiesībā nozīmē lielāka datu kopa?
- Kādi ir daži algoritma hiperparametru piemēri?
- Kas ir ansambļa mācīšanās?
- Ko darīt, ja izvēlētais mašīnmācīšanās algoritms nav piemērots un kā pārliecināties, ka ir izvēlēts pareizais?
- Vai mašīnmācīšanās modelim tā apmācības laikā ir nepieciešama uzraudzība?
- Kādi ir galvenie parametri, ko izmanto neironu tīklu algoritmos?
Skatiet citus jautājumus un atbildes pakalpojumā EITC/AI/GCML Google Cloud Machine Learning