Uzraudzīta un neuzraudzīta mācīšanās ir divi galvenie mašīnmācīšanās paradigmu veidi, kas kalpo atšķirīgiem mērķiem, pamatojoties uz datu raksturu un uzdevuma mērķiem. Lai izstrādātu efektīvus mašīnmācīšanās modeļus, ir ļoti svarīgi saprast, kad izmantot uzraudzītu apmācību salīdzinājumā ar neuzraudzītu apmācību. Izvēle starp šīm divām pieejām ir atkarīga no marķēto datu pieejamības, vēlamā rezultāta un datu kopas pamatā esošās struktūras.
Uzraudzītā mācīšanās ir mašīnmācīšanās veids, kurā modelis tiek apmācīts, izmantojot marķētu datu kopu. Uzraudzītā apmācībā algoritms iemācās kartēt ievades datus pareizajā izvadē, parādot apmācības piemērus. Šie apmācības piemēri sastāv no ievades-izejas pāriem, kur ievades datiem ir pievienota atbilstošā pareizā izvades vai mērķa vērtība. Uzraudzītās mācīšanās mērķis ir apgūt kartēšanas funkciju no ievades mainīgajiem uz izvades mainīgajiem, ko pēc tam var izmantot, lai prognozētu neredzētus datus.
Uzraudzītā mācīšanās parasti tiek izmantota, ja ir zināma vēlamā izvade un mērķis ir apgūt attiecības starp ievades un izvades mainīgajiem. To parasti izmanto tādos uzdevumos kā klasifikācija, kur mērķis ir paredzēt jaunu gadījumu klašu etiķetes, un regresija, kur mērķis ir paredzēt nepārtrauktu vērtību. Piemēram, uzraudzītā mācību scenārijā varat apmācīt modeli, lai prognozētu, vai e-pasts ir surogātpasts, pamatojoties uz e-pasta saturu un iepriekšējo e-pasta ziņojumu statusu, kas atzīmēts ar surogātpastu/ne-surogātpastu.
No otras puses, neuzraudzīta mācīšanās ir mašīnmācīšanās veids, kurā modelis tiek apmācīts, izmantojot nemarķētu datu kopu. Nepārraudzītas mācīšanās gadījumā algoritms apgūst modeļus un struktūras no ievades datiem bez skaidras atgriezeniskās saites par pareizo izvadi. Nepārraudzītas mācīšanās mērķis ir izpētīt datu pamatā esošo struktūru, atklāt slēptos modeļus un iegūt jēgpilnu ieskatu, neizmantojot marķētus datus.
Nepārraudzīta mācīšanās parasti tiek izmantota, ja mērķis ir izpētīt datus, atrast slēptos modeļus un grupēt līdzīgus datu punktus. To bieži izmanto tādos uzdevumos kā klasterizācija, kur mērķis ir grupēt līdzīgus datu punktus klasteros, pamatojoties uz to pazīmēm, un dimensiju samazināšana, kur mērķis ir samazināt līdzekļu skaitu, vienlaikus saglabājot datos būtisku informāciju. Piemēram, neuzraudzītā mācību scenārijā varat izmantot klasterizāciju, lai grupētu klientus, pamatojoties uz viņu pirkšanas paradumiem, bez jebkādām priekšzināšanām par klientu segmentiem.
Izvēle starp uzraudzītu un nekontrolētu mācīšanos ir atkarīga no vairākiem faktoriem. Ja jums ir marķēta datu kopa un vēlaties paredzēt konkrētus rezultātus, uzraudzīta mācīšanās ir piemērota izvēle. No otras puses, ja jums ir neiezīmēta datu kopa un vēlaties izpētīt datu struktūru vai atrast slēptos modeļus, piemērotāka ir mācīšanās bez uzraudzības. Dažos gadījumos var izmantot gan uzraudzītu, gan neuzraudzītu paņēmienu kombināciju, kas pazīstama kā daļēji uzraudzīta mācīšanās, lai izmantotu abu pieeju priekšrocības.
Lēmums izmantot uzraudzītu apmācību salīdzinājumā ar neuzraudzītu apmācību mašīnmācībā ir atkarīgs no marķētu datu pieejamības, uzdevuma rakstura un vēlamā rezultāta. Izpratne par atšķirībām starp uzraudzītu un neuzraudzītu mācīšanos ir būtiska, lai izstrādātu efektīvus mašīnmācīšanās modeļus, kas var iegūt jēgpilnu ieskatu un veikt precīzas prognozes no datiem.
Citi jaunākie jautājumi un atbildes par EITC/AI/GCML Google Cloud Machine Learning:
- Kas ir teksts runāšanai (TTS) un kā tas darbojas ar AI?
- Kādi ir ierobežojumi darbam ar lielām datu kopām mašīnmācībā?
- Vai mašīnmācība var sniegt dialogu?
- Kas ir TensorFlow rotaļu laukums?
- Ko patiesībā nozīmē lielāka datu kopa?
- Kādi ir daži algoritma hiperparametru piemēri?
- Kas ir ansambļa mācīšanās?
- Ko darīt, ja izvēlētais mašīnmācīšanās algoritms nav piemērots un kā pārliecināties, ka ir izvēlēts pareizais?
- Vai mašīnmācīšanās modelim tā apmācības laikā ir nepieciešama uzraudzība?
- Kādi ir galvenie parametri, ko izmanto neironu tīklu algoritmos?
Skatiet citus jautājumus un atbildes pakalpojumā EITC/AI/GCML Google Cloud Machine Learning