Google томруулж, зургийн сайжруулалтыг бодит болгож байна

Та гол дүрийн дүр төрхийг томруулж, үр дүнг сайжруулахыг хүссэн уран зөгнөлт кино, телевизийн шоуг үзсэн байх - нүүр царай, автомашины дугаар эсвэл бусад чухал нарийн ширийн зүйлийг харуулах. Google-ийн хамгийн сүүлийн үеийн хиймэл оюун ухаан (AI) системүүд гэж нэрлэгддэг зүйл дээр суурилсан диффузын загварууд, энэ трикийг гүйцэтгэх боломжтой.

Энэ нь бусад ижил төстэй зургууд дээр үндэслэсэн маш ухаалаг таамаглалыг ашиглан камерын авч амжаагүй зураг дээр нарийн ширийн зүйлийг нэмж оруулдаг тул үүнийг эзэмшихэд төвөгтэй процесс юм.

Google-ийн

Google-д энэ аргыг байгалийн зургийн синтез гэж нэрлэдэг бөгөөд энэ тохиолдолд хэт өндөр зургийн нягтралтай байдаг. Та жижиг, пикселтэй зургаас эхлээд хурц, тод, байгалийн зүйлээр төгсдөг. Энэ нь яг оригинал биш байж болох ч хүний нүдэнд бодит мэт харагдахуйц ойрхон байна.

Google энэ ажилд зориулж хоёр шинэ хиймэл оюун ухааны хэрэгслийг нэвтрүүлсэн. Эхнийх нь SR3 буюу давтагдсан сайжруулалтаар Super-Resolution гэж нэрлэгддэг бөгөөд энэ нь зураг дээр дуу чимээ нэмж, дараа нь арилгах замаар ажилладаг. Зургийн томоохон мэдээллийн сан болон машин сургалтын зарим ид шид дээр үндэслэсэн хэд хэдэн магадлалын тооцоололоор дамжуулан SR3 нь бага нарийвчлалтай пикселийн зургийн супер өндөр нарийвчлалтай хувилбар ямар байхыг төсөөлж чадна.

Хоёрдахь хэрэгсэл нь CDM буюу Cascaded Diffusion Models юм. Google эдгээрийг "дамжуулах хоолой" гэж тодорхойлдог бөгөөд тэдгээрийн дагуу SR3 гэх мэт тархалтын загваруудыг өндөр чанартай дүрсийг нэмэгдүүлэхэд чиглүүлж болно. Энэ нь сайжруулсан загваруудыг авч, илүү том зураг болгодог.

Google-ийн

Google-ийн үзэж байгаагаар өөр өөр нарийвчлалтайгаар сайжруулсан янз бүрийн загваруудыг ашигласнаар CDM арга нь зургийг томруулах өөр аргуудаас давж чаддаг. Шинэ хиймэл оюун ухааны хөдөлгүүрийг харааны объектыг таних судалгаанд ихэвчлэн ашигладаг сургалтын зургийн аварга том мэдээллийн сан болох ImageNet дээр туршсан.

SR3 болон CDM-ийн эцсийн үр дүн гайхалтай. 50 сайн дурын ажилтантай хийсэн стандарт туршилтанд SR3-ээр бүтээсэн хүний царайны зургийг 50 орчим хувь нь бодит зураг гэж андуурсан ба хамгийн тохиромжтой алгоритм нь 50%-д хүрэх ёстой гэж үзвэл энэ нь үнэхээр гайхалтай. Эдгээр сайжруулсан зургууд нь эх хувьтай яг таарч тохирохгүй, магадлалын математик дээр үндэслэн сайтар тооцоолсон загварчлал гэдгийг дахин хэлэх нь зүйтэй болов уу.

Google-ийн

Google нь шинэ хиймэл оюун ухаан, холбогдох технологиосоо зөвхөн царай болон бусад байгалийн объектын зургийг нэмэгдүүлэх төдийгүй магадлалын загварчлалын бусад салбарт илүү их зүйлийг амлаж байна.

Мөн уншина уу:

Эх сурвалжшинжлэх ухаан

Бүртгүүлэх

0 Сэтгэгдэл

Суулгасан тойм

Бүх сэтгэгдлийг харах

Бусад нийтлэлүүд

Кинон дээрх шиг: Google-ийн шинэ зураг боловсруулах хиймэл оюун ухаан нь томруулж, сайжруулж бодитой болгодог.

Сүүлийн үеийн сэтгэгдлүүд