Kepintaran buatan AlphaStar mencapai tahap Grandmaster di StarCraft II

Kecerdasan buatan permainan versi terbaru AlphaStar telah membuka tahap kemampuan sistem pintar yang baru. Buat pertama kalinya dalam sejarah, AI telah memenangi versi biasa, bukan versi modifikasi dari permainan dalam talian StarCraft II, yang memerangi manusia dengan keadaan di mana pemain-pemain sukan langsung bertanding. Dan dia secara konsisten mencapai peringkat tertinggi "Grandmaster" dalam pertempuran untuk setiap tiga perlumbaan: Terran, Protoss dan Zerg.

Titik perubahan dalam memelihara permainan AI datang tahun lalu ketika AlphaZero mengalahkan pendahulunya, AlphaGo. Pada tahun 2016, dia menjadi AI pertama yang mengalahkan juara dunia dalam permainan go, Lee Sedol, tetapi AlphaGo bertindak dengan cara kuno, berdasarkan peraturan dan strategi yang ditetapkan. AI AlphaZero baru sepenuhnya dibina berdasarkan prinsip pembelajaran mesin, belajar dari pengalamannya sendiri dan mencipta strategi kemenangan dengan sendirinya. Walaupun pada awalnya dia tidak tahu apa-apa mengenai permainan dan lawannya.

Cabaran berikutnya adalah permainan dengan maklumat yang tidak lengkap, seperti poker, dan strategi berbilang pemain. Ini sangat sukar bagi AI: anda perlu mengawal banyak unit musuh dan musuh anda, merancang pertempuran sekurang-kurangnya beberapa minit lebih awal, mengembangkan pangkalan anda, dan dapat menggabungkan pelbagai jenis aktiviti dengan pertukaran segera antara tugas. AlphaZero, setelah beberapa siri eksperimen, belajar mengatasi tugas ini, memenangi 95% masa. Tetapi masalah baru telah timbul - AI tidak memahami permainan itu sendiri, ia bertindak dengan menjauhkan diri dari proses, sebab itulah ia tidak dapat berkembang dengan betul.

AlphaStar (zerg, merah) menangkis serangan protoss awal

Penyelesaiannya datang dengan penciptaan sistem AlphaStar, yang belajar "mencipta kesulitan" untuk dirinya sendiri. Di sini juga, semuanya dibina berdasarkan pembelajaran mesin, tetapi jika sebelum ini semua agen kecerdasan buatan mempunyai tujuan untuk mengembangkan strategi yang berjaya, sekarang AI dengan sengaja mulai membahagi diri menjadi "pelajar" dan "penguji". Semasa latihan, yang terakhir cuba mengungkap sebanyak mungkin tempat musuh yang rentan, di samping itu, berlatih teknik berbahaya, seperti bersekongkol ketika bermain dalam mod "setiap orang untuk dirinya sendiri", permainan pemberian, dll. Setelah berjaya dengan cara ini, AlphaStar mencabar pemain terkuat di StarCraft, Dario "TLO" Wunsch dan Grzegorz "MaNa" Kominets, dan mengalahkan kedua-duanya.

Antara muka adalah penghalang terakhir. Orang bermain dengan kelajuan terhad klik butang, klik tetikus, tatal tatal dan pandangan medan perang, mereka melihat dan menilai set piksel, bukan paket data siap pakai. Memerlukan lebih dari setengah tahun untuk membuat mekanisme kawalan yang sesuai untuk AlphaStar, setelah itu AI dilancarkan ke Internet, di mana ia memerangi pemain manusia di Battle.net, pada peta sebenar dan dalam keadaan yang sama seperti mereka. Dan dia mencapai tahap 99, 8% kemenangan, setelah mendapat status grandmaster dalam semua perlumbaan yang dapat dimainkan.

AlphaStar (zerg, hijau) memenangi pertempuran terakhir dengan unit berteknologi tinggi yang lewat

Pencapaian utama di sini sama sekali bukan dalam kemenangan - ini hanya bukti yang meyakinkan bahawa algoritma pembelajaran mesin sejagat jenis ini dapat digunakan untuk menyelesaikan masalah sebenar yang kompleks. Contohnya, membuat drone, pembantu digital peribadi, tentera atau robot penyelidikan yang boleh beroperasi tanpa bantuan manusia.