Мэдрэлийн сүлжээ гэж юу вэ, тэд хэрхэн ажилладаг вэ? Root-Nation.com

Өнөөдөр бид мэдрэлийн сүлжээ гэж юу болох, тэд хэрхэн ажилладаг, хиймэл оюун ухааныг бий болгоход ямар үүрэг гүйцэтгэдэг болохыг олж мэдэхийг хичээх болно.

Мэдрэлийн сүлжээ. Бид энэ хэллэгийг бараг хаа сайгүй сонсдог. Энэ нь хөргөгчинд ч мэдрэлийн сүлжээг олох болно (энэ нь хошигнол биш юм). Мэдрэлийн сүлжээг машин сургалтын алгоритмууд өргөнөөр ашигладаг бөгөөд өнөөдөр үүнийг зөвхөн компьютер, ухаалаг гар утсанд төдийгүй бусад олон электрон төхөөрөмж, жишээлбэл гэр ахуйн цахилгаан хэрэгсэлд ашиглаж болно. Эдгээр мэдрэлийн сүлжээ гэж юу болохыг та бодож байсан уу?

Санаа зоволтгүй, энэ академик лекц биш. Нарийн шинжлэх ухааны салбарт энэ асуудлыг маш мэргэжлийн, найдвартай тайлбарласан олон хэвлэл, түүний дотор Украин хэл дээр байдаг. Ийм хэвлэлүүд арав гаруй жилийн настай. Эдгээр хуучин хэвлэлүүд хэрхэн хамааралтай хэвээр байна вэ? Мэдрэлийн сүлжээний үндэс суурь өөрчлөгдөөгүй бөгөөд энэ үзэл баримтлал нь хиймэл нейроны математик загвар нь дэлхийн -р дайны үед бий болсон явдал юм.

Интернэттэй адил өнөөгийн интернет нь анхны имэйл илгээсэн үеийнхтэй харьцуулашгүй илүү дэвшилтэт болсон. Интернетийн үндэс суурь, үндсэн протоколууд нь анх үүссэн цагаасаа л оршин тогтнож байсан. Бүх нарийн төвөгтэй үзэл баримтлал нь хуучин байгууламжийн суурин дээр баригдсан байдаг. Энэ нь бидний тархитай адил юм, хамгийн залуу тархины бор гадар нь хамгийн эртний хувьслын элементгүйгээр ажиллах боломжгүй байдаг: тархины үүдэл нь энэ гараг дээр бидний төрөл зүйл оршин тогтнохоос хамаагүй эрт дээр үеэс бидний толгойд байдаг.

Би чамайг жаахан андуурсан уу? Тиймээс илүү дэлгэрэнгүй ойлгоцгооё.

Мөн сонирхолтой: ChatGPT: Хэрэглэх энгийн заавар

АГУУЛГА

1. Мэдрэлийн сүлжээ гэж юу вэ?

2. Эхлээд хиймэл нейрон байсан

3. Загвараас эхлээд шинэлэг хэрэгжүүлэлт хүртэл

4. Мэдрэлийн сүлжээний сэргэн мандалт

5. Мэдрэлийн сүлжээ хэрхэн суралцдаг вэ?

Мэдрэлийн сүлжээ гэж юу вэ?

Сүлжээ нь тодорхой элементүүдийн цуглуулга юм. Энэ бол математик, физик эсвэл технологийн хамгийн энгийн арга юм. Хэрэв компьютерийн сүлжээ нь хоорондоо холбогдсон компьютеруудын багц юм бол мэдрэлийн сүлжээ нь нейронуудын багц гэдэг нь ойлгомжтой.

Гэсэн хэдий ч эдгээр элементүүд нь нарийн төвөгтэй байдлын хувьд бидний тархи, мэдрэлийн системийн мэдрэлийн эсүүдтэй бараг харьцуулшгүй боловч тодорхой түвшинд хийсвэрлэлд хиймэл мэдрэлийн болон биологийн нейроны зарим шинж чанарууд нийтлэг байдаг. Гэхдээ хиймэл нейрон нь түүний биологийн аналогиас хамаагүй энгийн ойлголт гэдгийг санах нь зүйтэй бөгөөд түүний талаар бид бүгдийг мэдэхгүй хэвээр байна.

- Зар сурталчилгаа -

Мөн уншина уу: ChatGPT-ийн хамгийн гайхалтай 7 хэрэглээ

Эхлээд хиймэл нейрон байсан

Хиймэл нейроны анхны математик загварыг 1943 онд (тиймээ, энэ бол дэлхийн -р дайны үед алдаа биш) Америкийн хоёр эрдэмтэн Уоррен МакКаллоч, Уолтер Питтс нар боловсруулсан. Тэд тархины физиологийн суурь мэдлэг (энэ загварыг бий болгосон үеийг санаарай), математик болон тэр үеийн залуу мэдээллийн технологийн хандлагыг (тэд бусад зүйлсийн дунд Алан Тюрингийн тооцооллын онолыг ашигласан) нэгтгэсэн салбар хоорондын хандлагын үндсэн дээр үүнийг хийж чадсан. ). McCulloch-Pitts хиймэл нейроны загвар нь маш энгийн загвар бөгөөд оролтын мэдээлэл нь жин (параметр) дамждаг олон оролттой бөгөөд тэдгээрийн утгууд нь нейроны зан төлөвийг тодорхойлдог. Үр дүнг нэг гаралт руу илгээдэг (МакКаллоч-Питтс нейроны диаграмыг үзнэ үү).

Ийм мод шиг бүтэц нь биологийн мэдрэлийн эсүүдтэй холбоотой байдаг, учир нь биологийн мэдрэлийн эсийг дүрсэлсэн зургийг бодоход энэ нь дендритүүдийн мод шиг өвөрмөц бүтэц юм. Гэсэн хэдий ч хиймэл нейрон нь жинхэнэ мэдрэлийн эстэй бага зэрэг ойрхон байдаг гэсэн хуурмаг зүйлд автахгүй байх ёстой. Анхны хиймэл нейроны зохиогчид болох эдгээр хоёр судлаач харилцан уялдаатай нейронуудын сүлжээг ашиглан аливаа тооцоолж болох функцийг тооцоолох боломжтой гэдгийг харуулж чадсан. Гэсэн хэдий ч эдгээр анхны ойлголтууд нь зөвхөн "цаасан дээр" байсан санаанууд хэлбэрээр бүтээгдсэн бөгөөд үйл ажиллагааны тоног төхөөрөмж хэлбэрээр бодит тайлбаргүй байсныг санацгаая.

Мөн уншина уу: Энгийн үгээр квант компьютерийн тухай

Загвараас эхлээд шинэлэг хэрэгжүүлэлт хүртэл

МакКаллоч, Питтс нар онолын загварыг боловсруулсан боловч анхны жинхэнэ мэдрэлийн сүлжээг бий болгоход арав гаруй жил хүлээх шаардлагатай болсон. Үүнийг бүтээгч нь хиймэл оюун ухааны судалгааны өөр нэг анхдагч Фрэнк Розенблатт гэж тооцогддог бөгөөд 1957 онд Марк I Perceptron сүлжээг бүтээсэн бөгөөд энэ бүтцийн ачаар машин урьд өмнө нь зөвхөн амьтан, хүмүүст байсан чадварыг олж авсныг та өөрөө харуулсан. сурч болно. Гэсэн хэдий ч, Розенблатаас өмнө ч машин сурах боломжтой гэсэн санааг гаргаж ирсэн бусад эрдэмтэд байсныг одоо бид мэднэ.

1950-иад оны үед олон судлаач, компьютерийн шинжлэх ухааны анхдагчид машиныг бие даан хийж чадахгүй зүйлээ хэрхэн хийх тухай санааг гаргаж ирсэн. Жишээлбэл, Артур Самуэль хүнтэй даам тоглодог, Аллен Ньюэлл, Герберт Саймон нар математик теоремуудыг бие даан баталж чадах программ зохиожээ. Розенблаттын анхны мэдрэлийн сүлжээг бүтээхээс өмнө хиймэл оюун ухааны салбарын судалгааны өөр хоёр анхдагчид болох Марвин Мински, Дин Эдмондс нар 1952 онд, өөрөөр хэлбэл Розенблаттын перцептрон гарч ирэхээс өмнө SNARC (Stochastic Neural) хэмээх машин бүтээжээ. Аналог арматурын тооцоолуур) - анхны стохастик мэдрэлийн сүлжээний компьютер гэж олон хүн үздэг стохастик мэдрэлийн аналог тооцоолуур арматур. SNARC нь орчин үеийн компьютеруудтай ямар ч холбоогүй гэдгийг тэмдэглэх нь зүйтэй.

3000 гаруй электрон хоолой, В-24 бөмбөгдөгч онгоцны сэлбэг автомат жолоодлого механизмыг ашигласан энэхүү хүчирхэг машин нь 40 мэдрэлийн эсийн үйл ажиллагааг дуурайж чаддаг байсан нь хархын төөрдөг байшингаас гарах замыг математикийн хувьд дуурайхад хангалттай юм. . Мэдээжийн хэрэг, харх байхгүй, зүгээр л хасалт хийх, оновчтой шийдлийг олох үйл явц байсан. Энэ машин нь Марвин Минскийн докторын зэрэг хамгаалсан.

Мэдрэлийн сүлжээн дэх өөр нэг сонирхолтой төсөл бол 1960 онд Бернард Витроугийн боловсруулсан ADALINE сүлжээ юм. Тиймээс, хагас зуун гаруй жилийн өмнө судлаачид мэдрэлийн сүлжээний онолын үндсийг мэддэг байсан бөгөөд ийм тооцооллын тогтолцооны анхны хэрэгжилтийг бий болгосон тул яагаад 21-р зуун хүртэл ийм удаан хугацаа зарцуулсан бэ гэсэн асуултыг тавьж болно. мэдрэлийн сүлжээнд суурилсан бодит шийдлүүдийг бий болгох уу? Хариулт нь нэг юм: тооцоолох хүчин чадал хангалтгүй, гэхдээ энэ нь цорын ганц саад тотгор биш байв.

Хэдийгээр 1950, 1960-аад оны үед хиймэл оюун ухааны олон анхдагчид мэдрэлийн сүлжээний боломжуудыг гайхшруулж байсан бөгөөд тэдний зарим нь хүний тархитай дүйцэхүйц машин бий болохоос ердөө аравхан жилийн дараа гэж таамаглаж байсан. Өнөөдөр үүнийг уншихад бүр инээдтэй байна, учир нь бид хүний тархитай дүйцэхүйц машин бүтээхэд ойртож амжаагүй байгаа бөгөөд энэ асуудлыг шийдэхээс хол байгаа. Анхны мэдрэлийн сүлжээнүүдийн логик нь сонирхолтой бөгөөд хязгаарлагдмал байсан нь хурдан тодорхой болсон. Хиймэл мэдрэлийн эсүүд болон машин сургалтын алгоритмуудыг ашиглан хиймэл оюун ухааны анхны хэрэгжүүлэлтүүд нь тодорхой нарийн хүрээний даалгавруудыг шийдвэрлэх боломжтой болсон.

Гэсэн хэдий ч, илүү өргөн хүрээг хамарч, хээ, дүрсийг таних, синхрон орчуулга, яриа, гар бичмэлийг таних гэх мэт үнэхээр ноцтой зүйлийг, өөрөөр хэлбэл компьютер болон хиймэл оюун ухаан өнөөдөр аль хэдийн хийж чадах зүйлсийг шийдэхэд хүрч ирэв. Мэдрэлийн сүлжээний анхны хэрэгжүүлэлтүүд үүнийг хийх боломжгүй байсан. Яагаад ийм байна вэ? Хариултыг Марвин Мински (тиймээ, SNARC-ийн ижилхэн) болон Сеймур Паперт нарын судалгаагаар өгсөн бөгөөд тэд 1969 онд перцептрон логикийн хязгаарлалтыг баталж, энгийн мэдрэлийн сүлжээний чадавхийг зөвхөн масштабаар нэмэгдүүлэх нь үр дүнгүй болохыг харуулсан. Өөр нэг, гэхдээ маш чухал саад бэрхшээл байсан - тэр үед ашиглах боломжтой тооцоолох хүчин чадал нь мэдрэлийн сүлжээг зориулалтын дагуу ашиглахад хэтэрхий бага байсан.

Мөн сонирхолтой:

- Зар сурталчилгаа -

Мэдрэлийн сүлжээний сэргэн мандалт

1970, 1980-аад онд мэдрэлийн сүлжээ бараг мартагдсан. Өнгөрсөн зууны төгсгөлд л боломжит тооцоолох хүчин чадал маш их болж, хүмүүс үүн рүү буцаж, энэ салбарт өөрсдийн чадвараа хөгжүүлж эхэлсэн. Тэр үед анхны энгийн мэдрэлийн сүлжээнүүдийн хязгаарлалтыг даван туулах шинэ функц, алгоритмууд гарч ирэв. Тэр үед олон давхаргат мэдрэлийн сүлжээг гүн гүнзгий машин сурах санаа гарч ирэв. Эдгээр давхаргад яг юу тохиолддог вэ? Өнөөдөр манай орчинд ажилладаг бараг бүх ашигтай мэдрэлийн сүлжээнүүд олон давхаргат байдаг. Бидэнд оролтын өгөгдөл болон параметрүүдийг (жин) хүлээн авах үүрэг бүхий оролтын давхарга бий. Эдгээр параметрүүдийн тоо нь сүлжээгээр шийдвэрлэх тооцооллын асуудлын нарийн төвөгтэй байдлаас хамаарч өөр өөр байдаг.

Нэмж дурдахад бид "далд давхаргууд" гэж нэрлэгддэг - гүн гүнзгий машин сурахтай холбоотой бүх "ид шид" энд тохиолддог. Энэ мэдрэлийн сүлжээг сурч, шаардлагатай тооцооллыг гүйцэтгэх чадварыг хариуцдаг далд давхаргууд юм. Эцэст нь эцсийн элемент бол гаралтын давхарга, өөрөөр хэлбэл хүссэн үр дүнг өгдөг мэдрэлийн сүлжээний давхарга бөгөөд энэ тохиолдолд хүлээн зөвшөөрөгдсөн гар бичмэл, нүүр царай, дуу хоолой, текстийн тайлбар дээр үндэслэсэн дүрс, томографийн шинжилгээний үр дүн юм. оношлогооны зураг болон бусад олон.

Мөн уншина уу: Би Bing-ийн чатботыг туршиж, ярилцлага хийсэн

Мэдрэлийн сүлжээ хэрхэн суралцдаг вэ?

Бидний мэдэж байгаагаар мэдрэлийн сүлжээн дэх бие даасан нейронууд нь бие даасан үнэ цэнэ, холболтоор хуваарилагдсан параметрүүдийн (жин) тусламжтайгаар мэдээллийг боловсруулдаг. Эдгээр жин нь сургалтын явцад өөрчлөгддөг бөгөөд энэ нь хүссэн үр дүнг бий болгох үүднээс энэ сүлжээний бүтцийг тохируулах боломжийг олгодог. Сүлжээ яг яаж сурдаг вэ? Энэ нь мэдээжийн хэрэг, үүнийг байнга сургаж байх ёстой. Энэ үгэнд бүү гайх. Бид ч бас суралцаж байгаа, энэ үйл явц эмх замбараагүй, эмх цэгцтэй гэж хэлье. Үүнийг бид боловсрол гэж нэрлэдэг. Ямар ч тохиолдолд мэдрэлийн сүлжээг сургаж болох бөгөөд энэ нь ихэвчлэн тохирох сонгосон оролтын багцыг ашиглан хийгддэг бөгөөд энэ нь сүлжээг ирээдүйд гүйцэтгэх ажлуудад ямар нэгэн байдлаар бэлтгэдэг. Энэ бүхэн алхам алхмаар давтагддаг, заримдаа сургалтын үйл явц нь тодорхой хэмжээгээр сургалтын үйл явцтай төстэй байдаг.

Жишээлбэл, энэ мэдрэлийн сүлжээний үүрэг бол нүүр царайг таних явдал юм бол нүүр царай агуулсан олон тооны зураг дээр урьдчилан бэлтгэгдсэн байдаг. Сургалтын явцад далд давхаргын жин ба параметрүүд өөрчлөгддөг. Мэргэжилтнүүд энд "зардлын функцийг багасгах" хэллэгийг ашигладаг. Зардлын функц нь өгөгдсөн мэдрэлийн сүлжээ хэр их алдаа гаргадаг болохыг бидэнд хэлдэг хэмжигдэхүүн юм. Сургалтын үр дүнд бид зардлын функцийг багасгах тусам энэ мэдрэлийн сүлжээ бодит ертөнцөд илүү сайн ажиллах болно. Аливаа мэдрэлийн сүлжээг сонгодог алгоритмаар програмчлагдсан даалгавраас ялгах хамгийн чухал онцлог нь сонгодог алгоритмын хувьд программист тухайн программ ямар үйлдлүүдийг гүйцэтгэхийг алхам алхмаар төлөвлөх ёстой. Мэдрэлийн сүлжээний хувьд сүлжээ өөрөө даалгавраа зөв хийж сурах чадвартай. Мөн нарийн төвөгтэй мэдрэлийн сүлжээ тооцоогоо хэрхэн гүйцэтгэдэгийг хэн ч мэдэхгүй.

Өнөөдөр мэдрэлийн сүлжээг өргөнөөр ашигладаг бөгөөд магадгүй гайхалтай нь тухайн сүлжээн дэх тооцоолох үйл явц хэрхэн ажилладагийг ойлгохгүйгээр ихэвчлэн ашигладаг. Ингэх шаардлага байхгүй. Программистууд тодорхой төрлийн өгөгдөл оруулахад бэлтгэгдсэн бэлэн машинд сургасан мэдрэлийн сүлжээг ашиглаж, зөвхөн өөрт нь мэдэгдэж буй аргаар боловсруулж, хүссэн үр дүнг гаргадаг. Програмист хүн мэдрэлийн сүлжээ дотор дүгнэлт хийх процесс хэрхэн явагддагийг мэдэх шаардлагагүй. Өөрөөр хэлбэл, хүн их хэмжээний тооцоолол, мэдээлэл олж авах, түүнийг мэдрэлийн сүлжээгээр боловсруулах аргаас хол байдаг. Хиймэл оюун ухааны загваруудын талаар хүн төрөлхтний тодорхой айдас эндээс үүдэлтэй. Хэзээ нэгэн цагт мэдрэлийн сүлжээ өөртөө тодорхой үүрэг даалгавар өгч, хүний тусламжгүйгээр бие даан шийдвэрлэх арга замыг олох болно гэж бид айж байна. Энэ нь хүн төрөлхтнийг түгшээж, машин сургалтын алгоритмыг ашиглахад айдас, үл итгэх байдлыг бий болгодог.

Энэхүү ашиг тустай хандлага өнөөдөр түгээмэл байдаг. Бидний хувьд ч мөн адил: бид хэн нэгнийг тодорхой үйл ажиллагаанд хэрхэн сургах талаар мэддэг бөгөөд сургалтын үйл явц нь зөв хийгдсэн тохиолдолд үр дүнтэй байх болно гэдгийг бид мэднэ. Хүн хүссэн ур чадвараа олж авна. Гэхдээ ийм үр нөлөөг үүсгэсэн суутгал хийх үйл явц түүний тархинд яг яаж явагддагийг бид ойлгож байна уу? Бидэнд ямар ч ойлголт алга.

Эрдэмтдийн үүрэг бол эдгээр асуудлыг аль болох судалж, шаардлагатай үед бидэнд үйлчилж, туслах, хамгийн чухал нь аюул занал учруулахгүй байх явдал юм. Хүмүүс бид мэдэхгүй зүйлээсээ айдаг.

Мөн сонирхолтой:

Зохиогчоос дэлгэрэнгүй

Бүртгүүлэх

0 Сэтгэгдэл

Суулгасан тойм

Бүх сэтгэгдлийг харах

Бусад нийтлэлүүд

Мэдрэлийн сүлжээ гэж юу вэ, тэд хэрхэн ажилладаг вэ?

Мэдрэлийн сүлжээ гэж юу вэ?

Эхлээд хиймэл нейрон байсан

Загвараас эхлээд шинэлэг хэрэгжүүлэлт хүртэл

Мэдрэлийн сүлжээний сэргэн мандалт

Мэдрэлийн сүлжээ хэрхэн суралцдаг вэ?

Сүүлийн үеийн сэтгэгдлүүд