AI masih gagal pada pengiktirafan angka tulisan tangan yang mantap (dan bagaimana untuk memperbaikinya)

Pembelajaran Deep telah dipuji untuk menyelesaikan segala-galanya dari kereta memandu sendiri ke iklim dunia. Walau bagaimanapun, rangkaian neural yang mendalam (kerja keras Deep Learning) gagal menyelesaikan tugas-tugas yang paling biasa dengan memuaskan: pengiktirafan angka tulisan tangan yang mantap. Pertimbangkan contoh berikut:

Imej

Nombor di bawah setiap digit menunjukkan ramalan rangkaian. Ia mengklasifikasikan semua sampel dengan betul. Jadi apa masalahnya? Nah, pertimbangkan imej berikut:

... pengubahsuaian kecil benar-benar boleh menggagalkan keputusan rangkaian.

Kami mengubah suai imej hanya sedikit, tetapi kini rangkaian saraf mengelirukan semuanya. Ini jenis "adversarial" input telah diketahui selama bertahun-tahun. Mereka memberi kesan pada dasarnya setiap aplikasi Deep Learning daripada pengiktirafan objek, segmen imej semantik, pengecaman pertuturan untuk penapisan spam. Cukup banyak setiap rangkaian saraf tunggal yang sedang digunakan dipengaruhi dan boleh diserang (termasuk misalnya Siri atau Amazon Echo).

Tetapi ia menjadi semakin buruk: pertimbangkan set imej berikut:

Imej-imej ini dikelaskan dengan keyakinan tinggi sebagai

Adakah anda mengenali walaupun tanda tangan yang ditulis tangan? Tidak? Rangkaian saraf sangat pasti bahawa ini adalah semua sifar. Imej-imej yang dikenali sebagai imej-imej yang tidak dikenali ini menyerlahkan masalah lain dengan rangkaian saraf hari ini: mereka berkelakuan tidak menentu jika inputnya terlalu jauh dari data "normal" (dalam kes ini bising bukan angka).

Masalah kekukuhan ini telah diiktiraf oleh ramai sebagai salah satu blok jalan utama menuju penggunaan Deep Learning. Bukan sahaja kerana sebab keselamatan, tetapi kerana kegagalan ini menyerlahkan bahawa kita tidak tahu bagaimana rangkaian saraf benar-benar beroperasi dan ciri imej yang mereka gunakan untuk klasifikasi. Bilangan kertas kerja yang cuba untuk menyelesaikan masalah ini meningkat dengan pesat sepanjang dua tahun yang lalu, tetapi setakat ini tidak berhasil. Malah, rangkaian saraf yang kami gunakan untuk mengklasifikasikan digit tulisan tangan di atas kini diiktiraf sebagai model yang paling teguh (Madry et al.). Hakikat ini menyoroti sejauh mana kita dari model pengiktirafan yang teguh - walaupun untuk digit tulisan tangan mudah.

Dalam kertas kerja baru-baru ini, kami memperkenalkan konsep baru untuk mengklasifikasikan imej dengan kuat. Idea ini sangat mudah: jika imej diklasifikasikan sebagai tujuh, ia harus mengandungi kira-kira dua baris - satu lebih pendek, satu lagi - yang menyentuh satu sama lain pada satu hujung. Itulah cara generatif untuk memikirkan digit, yang sangat semulajadi bagi manusia dan yang membolehkan kita dengan mudah melihat isyarat (garisan) walaupun di tengah-tengah banyak bunyi dan gangguan. Mempunyai model sedemikian harus memudahkan untuk mengklasifikasikan contoh-contoh adversarial yang dipaparkan di atas ke dalam kelas yang betul. Belajar model angka generatif (katakan sifar) cukup mudah (menggunakan Autoagoder Variasi) dan, secara ringkasnya, berfungsi seperti berikut: kita mula dari ruang penderaan gangguan pembolehubah (yang mungkin menangkap perkara seperti ketebalan atau kecondongan digit dan dipelajari dari data) dan menghasilkan imej menggunakan rangkaian saraf. Kami kemudiannya menunjukkan contoh sifar tulisan tangan dan melatih rangkaian untuk menghasilkan yang serupa. Pada akhir latihan, rangkaian telah mempelajari tentang variasi semulajadi nol tulisan tangan:

Satu model nol generatif mempelajari variasi biasa digit tulisan tangan (sebelah kanan).

Kami mempelajari model generatif sedemikian untuk setiap digit. Kemudian, apabila input baharu datang, kami periksa model digit mana yang paling sesuai dengan input baharu. Prosedur ini biasanya dipanggil analisa-oleh-sintesis, kerana kita menganalisis kandungan gambar mengikut model yang dapat mensintesiskannya. Rangkaian feedforward standard, sebaliknya, tidak mempunyai mekanisme maklum balas untuk memeriksa sama ada imej input benar-benar menyerupai kelas yang disimpulkan:

Rangkaian feedforward terus pergi dari imej ke kelas dan tidak ada cara untuk memeriksa bahawa klasifikasi masuk akal. Model analisa-oleh-sintesis kami menyemak ciri-ciri imej yang ada dan dikelaskan mengikut kelas yang paling masuk akal.

Itulah perbezaan utama: rangkaian feedforward tidak mempunyai cara untuk memeriksa ramalan mereka, anda perlu mempercayai mereka. Model analisa-oleh-sintesis kami, sebaliknya, melihat sama ada ciri imej tertentu benar-benar hadir dalam input sebelum melompat ke kesimpulan.

Kami tidak memerlukan model generatif sempurna untuk prosedur ini untuk berfungsi. Model digit tulisan tangan kami pastinya tidak sempurna: lihat pada tepi kabur. Walau bagaimanapun, model kami boleh mengklasifikasikan digit bertulis tangan dengan ketepatan yang tinggi (99,0%) dan keputusannya membuat banyak pengertian kepada manusia. Sebagai contoh, model itu akan sentiasa memberi keyakinan rendah terhadap imej bunyi, kerana ia tidak kelihatan seperti mana-mana angka yang pernah dilihat sebelumnya. Imej-imej yang paling dekat dengan bunyi yang model analisa-oleh-sintesis masih diklasifikasikan sebagai digit dengan keyakinan tinggi membuat banyak akal kepada manusia:

Kami cuba mensintesis imej yang tidak dikenali yang masih dikelaskan sebagai sifar dengan keyakinan tinggi oleh model analisis-oleh-sintesis kami. Inilah yang terbaik.

Dalam model canggih terkini oleh Madry et al. kami mendapati bahawa gangguan minimum digit bersih sering mencukupi untuk menggagalkan klasifikasi model. Melakukan sama untuk model analisis-oleh-sintesis kami menghasilkan keputusan yang berbeza:

Contoh-contoh adversarial untuk analisis-oleh-sintesis model. Bolehkah anda meneka nombor asal?

Perhatikan bahawa perturbasi membuat banyak akal kepada manusia dan kadang-kadang sukar untuk menentukan ke mana kelas imej harus diklasifikasikan. Itulah apa yang kita harapkan berlaku untuk model klasifikasi yang teguh.

Model kami mempunyai beberapa ciri penting lain. Contohnya, keputusan model analisis-oleh-sintesis lebih mudah difahami kerana seseorang dapat melihat secara langsung ciri-ciri yang mempengaruhi model terhadap keputusan tertentu. Di samping itu, kita juga dapat memperoleh beberapa batas yang lebih rendah dari kekukuhannya.

Model analisa-oleh-sintesis tidak sepadan dengan persepsi manusia dan masih ada jalan panjang untuk pergi (lihat analisis penuh dalam manuskrip kita). Walau bagaimanapun, kami percaya keputusan ini sangat menggalakkan dan kami berharap kerja kami akan membuka jalan ke arah kelas klasifikasi baru yang tepat, teguh dan boleh ditafsirkan. Kami masih perlu belajar banyak tentang model-model baru ini, paling tidak semua cara membuat kesimpulan lebih efisien dan bagaimana untuk membuat skala kepada set data yang lebih kompleks (seperti CIFAR atau ImageNet). Kami bekerja keras untuk menjawab soalan-soalan ini dan tidak sabar-sabar untuk berkongsi lebih banyak hasil dengan anda pada masa akan datang.

Ke arah model rangkaian neural yang teguh pada MNIST

Lukas Schott, Jonas Rauber, Matthias Bethge, Wieland Brendel
arXiv: 1805.09190