Piemērā izmantotā neironu tīkla arhitektūra ir uz priekšu vērsts neironu tīkls ar trīs slāņiem: ievades slāni, slēpto slāni un izvades slāni. Ievades slānis sastāv no 784 vienībām, kas atbilst pikseļu skaitam ievades attēlā. Katra ievades slāņa vienība apzīmē attēla pikseļa intensitātes vērtību.
Slēptais slānis sastāv no 128 vienībām, kuras ir pilnībā savienotas ar ievades slāni. Katra slēptā slāņa vienība aprēķina ievades slāņa ievades svērto summu un izmanto aktivizācijas funkciju, lai iegūtu izvadi. Šajā piemērā slēptajā slānī izmantotā aktivizācijas funkcija ir rektificētās lineārās vienības (ReLU) funkcija. Funkcija ReLU ir definēta kā f(x) = max(0, x), kur x ir vienības ievades svērtā summa. Funkcija ReLU ievieš tīklā nelinearitāti, ļaujot tam apgūt sarežģītus datu modeļus un attiecības.
Izvades slānis sastāv no 10 vienībām, no kurām katra pārstāv vienu no iespējamām klasifikācijas uzdevuma klasēm. Izvades slāņa vienības ir arī pilnībā savienotas ar slēptā slāņa vienībām. Līdzīgi kā slēptajā slānī, katra izvades slāņa vienība aprēķina slēptā slāņa ievades svērto summu un izmanto aktivizācijas funkciju. Šajā piemērā izvades slānī izmantotā aktivizācijas funkcija ir softmax funkcija. Funkcija softmax pārveido ievades svērto summu varbūtības sadalījumā pa klasēm, kur varbūtību summa ir vienāda ar 1. Vienība ar lielāko varbūtību apzīmē ievades attēla paredzamo klasi.
Rezumējot, piemērā izmantotā neironu tīkla arhitektūra sastāv no ievades slāņa ar 784 vienībām, slēptā slāņa ar 128 vienībām, izmantojot ReLU aktivizācijas funkciju, un izvades slāņa ar 10 vienībām, izmantojot softmax aktivizācijas funkciju.
Citi jaunākie jautājumi un atbildes par Neironu tīkla izveide klasifikācijas veikšanai:
- Vai mašīnmācīšanās modeļiem, kas darbojas TensorFlow.js, ir jāizmanto asinhronā mācīšanās funkcija?
- Kā modelis tiek apkopots un apmācīts vietnē TensorFlow.js, un kāda ir kategoriskā krustentropijas zuduma funkcijas loma?
- Kāda ir mācīšanās ātruma un laikmetu skaita nozīme mašīnmācīšanās procesā?
- Kā programmā TensorFlow.js apmācības dati tiek sadalīti treniņu un testu komplektos?
- Kāds ir TensorFlow.js mērķis, veidojot neironu tīklu klasifikācijas uzdevumiem?