Peta Pengetahuan AI: bagaimana mengklasifikasikan teknologi AI

Lakaran landskap teknologi AI yang baru

Versi pendek dari artikel ini muncul pertama di Forbes

Artikel itu juga telah dianugerahkan dengan lencana Perak oleh KDnuggets sebagai salah satu yang paling banyak dibaca dan dikongsi pada Ogos 2018.

I. Pemikiran pengenalan

Saya telah berada di ruang kecerdasan buatan untuk sementara waktu, dan saya sedar bahawa pelbagai klasifikasi, perbezaan, lanskap, dan maklumat grafik wujud untuk mewakili dan mengesan cara yang berbeza untuk memikirkan AI. Walau bagaimanapun, saya bukan seorang peminat besar dalam latihan pengkategorian ini, terutamanya kerana saya cenderung untuk berfikir bahawa usaha mengklasifikasikan titik data dinamik ke dalam kotak pembetulan yang telah ditetapkan adalah selalunya tidak berfaedah untuk mendapat kerangka "jelas" seperti ini (ini adalah generalisasi Sudah tentu, kadang kala mereka sangat berguna).

Apabila ia datang khusus untuk kecerdasan buatan, saya juga berpendapat bahawa banyak kategorisasi di luar sana sama ada tidak lengkap atau tidak dapat menangkap pautan asas yang kuat dan aspek gelombang AI yang baru ini.

Oleh itu, biarkan saya mula-mula memberitahu anda rasional untuk jawatan ini. Bekerja dengan agensi inovasi strategik Chôra, kami ingin mencipta alat visual untuk orang memahami sekilas dan kerumitan kotak peralatan ini, serta meletakkan peta yang dapat membantu orang yang berorientasi di hutan AI. Anda harus melihat graf berikut sebagai cara untuk menyusun pengetahuan yang tidak terstruktur ke dalam jenis ontologi dengan matlamat akhir untuk tidak mewakili semua maklumat yang ada pada AI secara tepat tetapi mempunyai alat untuk menerangkan dan mengakses sebahagian daripada maklumat yang ditetapkan.

Apa yang berikut kemudian adalah usaha untuk menarik seni bina untuk mengakses pengetahuan mengenai AI dan mengikuti dinamik muncul, pintu masuk pada pengetahuan yang sedia ada mengenai topik yang akan membolehkan anda untuk mengamati maklumat tambahan dan akhirnya mencipta pengetahuan baru mengenai AI.

Oleh itu, utiliti kerja akhir sepatutnya membantu anda mencapai tiga perkara: memahami apa yang sedang berlaku dan mempunyai peta untuk mengikuti jalan; pemahaman di mana kecerdasan mesin digunakan hari ini (berkenaan dengan mana tidak digunakan pada masa lalu); memahami apa dan berapa banyak masalah yang diperbaharui untuk membolehkan AI menangani mereka (jika anda sudah biasa dengan karya Agrawal et al., 2018 adalah akibat langsung dari penurunan kos teknologi ramalan).

Artikel ini pada prinsipnya menargetkan kedua-dua orang yang memulakan AI untuk memberi mereka gambaran luas mengenai apa yang ada di sana, serta pakar dan pengamal yang bereksperimen dengan teknologi ini untuk sementara waktu (dengan permintaan yang jelas untuk menghantar maklum balas tentang bagaimana anda akan menyusunnya atau teknologi lain yang perlu ditangkap oleh spektrum AI).

Saya juga menyedari ini adalah satu tugas yang besar, jadi semata-mata melihat ini sebagai draf pertama atau percubaan untuk melakukannya dan bukan penyelesaian akhir dalam batu.

Izinkan saya juga menyimpulkan pengenalan ini dengan sesuatu yang saya dapati untuk mencapai matlamat untuk mencipta visual ini: sangat sukar. Mencuba untuk mewakili sebanyak mungkin maklumat dalam peta tidak jelas dua dimensi telah menjadi sangat mencabar, sesuatu yang anda tidak sedar sehingga anda cuba melakukannya sendiri. Saya menjemput anda semua untuk melakukan perkara yang sama untuk memahami apa yang saya maksudkan (percaya kepada saya, tidak mudah sama sekali kerana diberi perbezaan pendapat, pandangan dan pendekatan yang digunakan dalam AI dalam 60 tahun yang lalu). Ini membawa saya kepada penafian terakhir: kadang-kadang saya harus menghampiri konsep atau klasifikasi itu sendiri demi menjaga ketaksamaan antara ketepatan dan kejelasan, jadi maafkan saya terlebih dahulu untuk salah penyataan yang kecil (atau utama, kepada seseorang).

Oleh itu, mari melompat ke Peta Pengetahuan AI (AIKM) sekarang.

II. Pendekatan domain + Pendekatan = Penyelesaian Teknologi

Jadi di sini kita pergi, itu sahaja. Anda mungkin mengharapkan diberi pengenalan enjin VR pelik yang mempamerkan banyak berkas lampu untuk setiap teknologi, tetapi ia bukan graf bi-dimensi lama. Semudah itu.

Mari kita lihat sedikit lebih dekat.

Di atas paksi, anda akan menemui dua kumpulan makro, iaitu Paradigma AI dan Masalah Masalah AI. Paradigma AI (paksi-X) adalah benar-benar pendekatan yang digunakan oleh penyelidik AI untuk menyelesaikan masalah yang berkaitan dengan AI (ini termasuk pendekatan yang kita ketahui sehingga kini). Di sisi lain, Domain Masalah AI (paksi Y) secara sejarah adalah jenis masalah AI dapat menyelesaikannya. Dalam erti kata lain, ia juga menunjukkan potensi keupayaan teknologi AI.

Oleh itu, saya telah mengenal pasti berikut paradigma AI:

  • Alat berasaskan logik: alat yang digunakan untuk perwakilan pengetahuan dan penyelesaian masalah;
  • Alat berasaskan pengetahuan: alat berdasarkan ontologi dan pangkalan data yang besar mengenai tanggapan, maklumat, dan peraturan;
  • Kaedah probabilistik: alat yang membolehkan agen bertindak dalam senario maklumat yang tidak lengkap;
  • Pembelajaran mesin: alat yang membolehkan komputer belajar daripada data;
  • Kecerdasan terkandung: kotak peralatan kejuruteraan, yang menganggap bahawa badan (atau setidaknya satu set fungsi seperti pergerakan, persepsi, interaksi, dan visualisasi) diperlukan untuk kecerdasan yang lebih tinggi;
  • Carian dan pengoptimuman: alat yang membenarkan carian bijak melalui banyak penyelesaian yang mungkin.

Enam paradigma ini juga termasuk dalam tiga pendekatan makro yang berbeza, iaitu Simbolik, Sub-simbolik dan Statistik (diwakili oleh warna yang berbeza). Ringkasnya, pendekatan Simbolik menyatakan bahawa kecerdasan manusia boleh dikurangkan menjadi manipulasi simbol, Sub-simbol yang tidak mempunyai perwakilan pengetahuan khusus harus disediakan ex-ante, sementara pendekatan Statistik berdasarkan alat matematik untuk menyelesaikan sub-masalah tertentu.

Nota tambahan yang cepat: anda mungkin mendengar orang bercakap tentang "suku AI", konsep yang diajukan oleh Pedro Domingos (2015) yang mengelompokkan penyelidik dalam kumpulan berdasarkan pendekatan yang mereka gunakan untuk menyelesaikan masalah. Anda boleh dengan mudah memetakan lima suku dengan klasifikasi paradigma kami (tidak mempertimbangkan kumpulan perisikan yang diwakili), iaitu para simbolik dengan pendekatan berasaskan Logik (mereka menggunakan penalaran logikal berdasarkan simbol abstrak); Penyambung dengan pembelajaran Mesin (mereka diilhamkan oleh otak mamalia); Evolusioner dengan Search and Optimization (mereka terinspirasi oleh evolusi Darwin); Bayesian dengan kaedah Probabilistic (mereka menggunakan pemodelan probabilistik); dan akhirnya Analogizers dengan kaedah berasaskan pengetahuan, kerana mereka cuba untuk mengekstrapolasi dari pengetahuan yang ada dan kes yang serupa sebelumnya.

Paksi menegak sebaliknya meletakkan masalah AI telah digunakan, dan klasifikasi di sini agak standard:

  • Penaakulan: keupayaan menyelesaikan masalah;
  • Pengetahuan: keupayaan untuk mewakili dan memahami dunia;
  • Perancangan: keupayaan menetapkan dan mencapai matlamat;
  • Komunikasi: keupayaan untuk memahami bahasa dan berkomunikasi;
  • Persepsi: keupayaan untuk mengubah input sensor mentah (mis., Imej, bunyi, dan lain-lain) ke dalam maklumat yang boleh digunakan.

Saya masih menyoal diri saya sama ada klasifikasi ini cukup besar untuk menangkap semua spektrum masalah yang sedang kita hadapi atau sama ada lebih banyak contoh harus ditambahkan (contohnya, Kreativiti atau Gerakan). Buat masa ini, saya akan tetap dengan 5 kluster satu.

Corak kotak bukannya membahagikan teknologi kepada dua kumpulan, iaitu, aplikasi sempit dan aplikasi am. Kata-kata yang digunakan adalah bertujuan sedikit mengelirukan tetapi menanggung dengan saya selama satu saat dan saya akan menerangkan apa yang saya maksudkan. Bagi sesiapa sahaja yang bermula di AI, mengetahui perbezaan antara Lemah / Narrow AI (ANI), Strong / General AI (AGI), dan Super Intelligence Artificial Intelligence (ASI) adalah yang paling utama. Demi kejelasan, ASI hanya spekulasi yang terkini, General AI adalah matlamat akhir dan penyelidik suci, sementara AI sempit adalah apa yang kita ada hari ini, iaitu satu set teknologi yang tidak dapat menampung apa-apa di luar skop mereka (yang merupakan perbezaan utama dengan AGI).

Kedua-dua jenis garisan yang digunakan dalam graf (berterusan dan bertitik) kemudian ingin secara eksplisit menunjukkan perbezaan itu dan membuat anda yakin bahawa apabila anda akan membaca beberapa bahan AI pengantar lain anda tidak akan hilang sepenuhnya. Walau bagaimanapun, pada masa yang sama, perbezaan di sini menggariskan teknologi yang hanya boleh menyelesaikan tugas tertentu (biasanya lebih baik daripada manusia - Aplikasi sempit) dan lain-lain yang boleh hari ini atau pada masa akan datang menyelesaikan pelbagai tugas dan berinteraksi dengan dunia (lebih baik daripada banyak manusia - Aplikasi am).

Akhirnya, mari kita lihat apa yang ada dalam graf itu sendiri. Dalam peta, pelbagai kelas teknologi AI diwakili. Perhatikan, saya dengan sengaja tidak menamakan algoritma tertentu tetapi menggumpal mereka ke dalam kumpulan makro. Saya tidak memberikan penilaian bernilai apa yang berfungsi dan apa yang tidak, tetapi hanya menyenaraikan penyelidik dan saintis data yang boleh memanfaatkannya.

Jadi bagaimana anda membaca dan mentafsirkan peta? Baiklah, berikan saya dua contoh untuk membantu anda melakukannya. Jika anda melihat Pemprosesan Bahasa Semula Jadi, ini membenamkan satu kelas algoritma yang menggunakan gabungan pendekatan berasaskan pengetahuan, pembelajaran mesin dan kaedah probabilistik untuk menyelesaikan masalah dalam domain persepsi. Pada masa yang sama walaupun, jika anda melihat ruang kosong di persimpangan antara paradigma berasaskan Logik dan Masalah penalaran, anda mungkin tertanya-tanya mengapa tidak ada teknologi di sana. Apa yang disampaikan oleh peta bukanlah bahawa ia tidak mempunyai kaedah yang boleh mengisi ruang tersebut, tetapi apabila orang mendekati masalah penalaran, mereka lebih suka menggunakan pendekatan Pembelajaran Mesin, misalnya.

Untuk menyimpulkan penjelasan ini, ini adalah senarai penuh teknologi yang termasuk dengan definisi mereka sendiri:

  • Automasi Proses Robotik (RPA): teknologi yang mengekstrak senarai peraturan dan tindakan untuk dilakukan dengan memerhatikan pengguna melakukan tugas tertentu;
  • Sistem Pakar: program komputer yang mempunyai peraturan berkod keras untuk mencontohi proses pembuatan keputusan manusia. Sistem fuzzy adalah contoh khusus sistem berasaskan peraturan yang memetakan pembolehubah ke dalam kontinum nilai antara 0 dan 1, bertentangan dengan logik digital tradisional yang menghasilkan hasil 0/1;
  • Visi Komputer (CV): kaedah untuk memperoleh dan memahami imej digital (biasanya dibahagikan kepada pengiktirafan aktiviti, pengiktirafan imej dan penglihatan mesin);
  • Pemprosesan Bahasa Asli (NLP): sub-bidang yang mengendalikan data bahasa semula jadi (tiga blok utama yang dimiliki oleh bidang ini, iaitu, pemahaman bahasa, penjanaan bahasa, dan terjemahan mesin);
  • Rangkaian Neural (NNs atau ANNs): kelas algoritma longgar dimodelkan selepas struktur neuron otak manusia / haiwan yang meningkatkan prestasinya tanpa secara eksplisit diarahkan bagaimana untuk melakukannya. Kedua-dua jurusan dan sub-kelas NN yang terkenal adalah Deep Learning (jaring saraf dengan pelbagai lapisan) dan Rangkaian Adversarial Generatif (GAN - dua rangkaian yang melatih antara satu sama lain);
  • Sistem Autonomi: sub-bidang yang terletak di persimpangan antara robotik dan sistem pintar (mis., Persepsi pintar, manipulasi objek yang dexterous, kawalan robot berasaskan pelan, dan lain-lain);
  • Kecerdasan Buatan Teragih (DAI): kelas teknologi yang menyelesaikan masalah dengan mengedarkannya kepada "ejen" yang berautonomi yang berinteraksi antara satu sama lain. Sistem multi-agen (MAS), pemodelan berasaskan Agen (ABM), dan Perisikan Swarm adalah tiga spesifikasi berguna subset ini, di mana tingkah laku kolektif muncul daripada interaksi ejen yang tersusun sendiri;
  • Affective Computing: sub-field yang menangani pengiktirafan emosi, tafsiran, dan simulasi;
  • Algoritma Evolusi (EA): ia merupakan subset dari domain sains komputer yang lebih luas yang dinamakan perhitungan evolusi yang menggunakan mekanisme yang diilhami oleh biologi (mis., Mutasi, pembiakan, dll) untuk mencari penyelesaian yang optimum. Algoritma genetik adalah sub-kumpulan EA yang paling banyak digunakan, iaitu pencarian heuristik yang mengikuti proses pemilihan semulajadi untuk memilih penyelesaian kandidat "paling tepat";
  • Pengaturcaraan Logik Induktif (ILP): sub-bidang yang menggunakan logik formal untuk mewakili pangkalan data fakta dan merumuskan hipotesis yang berasal dari data tersebut;
  • Rangkaian Keputusan: adalah penyebaran rangkaian / kesimpulan Bayesian yang paling terkenal, yang mewakili satu set pembolehubah dan hubungan probabilistik mereka melalui peta (juga dipanggil grafik asiklik yang diarahkan);
  • Pemrograman Probabilistic: rangka kerja yang tidak memaksa anda untuk pembolehubah spesifik hardcode tetapi berfungsi dengan model probabilistik. Sintesis Program Bayesian (BPS) entah bagaimana adalah satu bentuk pengaturcaraan probabilistik, di mana program Bayesian menulis program-program baru Bayesian (bukan manusia melakukannya, seperti dalam pendekatan pengaturcaraan probabiliti yang lebih luas);
  • Ambient Intelligence (AmI): rangka kerja yang menuntut peranti fizikal ke dalam persekitaran digital untuk memahami, melihat, dan bertindak balas dengan kesadaran konteks kepada rangsangan luar (biasanya dipicu oleh tindakan manusia).

Untuk menyelesaikan masalah tertentu, anda mungkin mengikuti satu atau lebih pendekatan, yang pada gilirannya bermaksud satu atau lebih teknologi yang diberikan bahawa banyak daripada mereka tidak sama sekali eksklusif tetapi lebih pelengkap.

Akhirnya, ada klasifikasi yang lain yang saya tidak tertanam dalam graf di atas (iaitu, jenis analitik yang berbeza) tetapi yang patut disebutkan demi kesempurnaan. Anda sebenarnya mungkin menemui lima jenis analitik yang berbeda: analisis deskriptif (apa yang terjadi); analisis diagnostik (mengapa sesuatu berlaku); analisis ramalan (apa yang akan berlaku); analisis preskriptif (mengesyorkan tindakan); dan analisis automatik (mengambil tindakan secara automatik). Anda juga mungkin tergoda untuk menggunakannya entah bagaimana mengklasifikasikan teknologi di atas, tetapi kenyataannya adalah bahawa ini adalah klasifikasi berfungsi dan satu proses bukan satu produk - dengan kata lain, setiap teknologi dalam spektrum dapat memenuhi lima fungsi analisis .

III. Kesimpulannya

Mengajar komputer bagaimana untuk belajar tanpa perlu diprogram secara terperinci adalah tugas berat yang melibatkan beberapa teknologi untuk menghadapi pelbagai nuansa, dan walaupun peta ini jauh dari sempurna, sekurang-kurangnya percubaan pertama untuk memahami sesuatu landskap yang tidak kemas sebagai salah satu kecerdasan buatan adalah.

Saya amat menyedari bahawa prinsip Pareto yang kuat muncul di sini, iaitu, 80% (jika tidak lebih) usaha dan keputusan semasa didorong oleh 20% teknologi yang digambarkan dalam peta (iaitu pembelajaran mendalam, NLP, dan komputer penglihatan), tetapi saya juga yakin bahawa mempunyai spektrum penuh mungkin membantu penyelidik, pemula, dan pelabur.

Di samping cuba untuk membenamkan dan mempertimbangkan maklum balas dan komen pada versi pertama ini, saya merancang untuk mengambil dua langkah lagi di masa depan: satu adalah mewujudkan lapisan untuk jenis cabaran yang dihadapi AI (contohnya, masalah ingatan dan melupakan malapetaka, pembelajaran pemindahan, belajar dari data yang lebih sedikit dengan perkara-perkara seperti sifar dan pembelajaran satu-shot, dan lain-lain) dan teknologi apa yang boleh digunakan untuk mengatasi masalah tertentu itu. Kedua, cuba memohon kanta untuk melihat teknologi yang berbeza dan bukan masalah yang mereka selesaikan tetapi yang mereka buat (contohnya, isu etika, masalah intensif data, masalah hitam dan masalah dijelaskan, dan sebagainya).

Sekiranya anda mempunyai sebarang komen mengenai bagaimana untuk memperbaiki kerja atau cadangan yang sedia ada tentang cara menanamkan dua langkah tambahan, sila hubungi!

Dan jika anda adalah syarikat yang bekerja dengan mana-mana teknologi yang disebutkan di atas, saya lebih suka mendengar lebih banyak daripada anda.

Pendedahan: Peta pengetahuan AI telah dibangunkan dengan perundingan inovasi strategik Axilo, untuk aktiviti di platform Chôra mereka.

Rujukan

Agrawal, A., Gans, J., Goldfarb, A. (2018). "Prediksi Mesin: Ekonomi Ringkas Kecerdasan Buatan". Press Review Perniagaan Harvard.

Domingos, P. (2015). "Algoritma Induk: Bagaimana Quest untuk Mesin Pembelajaran Muktamad Akan Membuat Semula Dunia Kita". New York: Buku Asas.