Setelah sekian lama, nilai sempurna game klasik Ms. Pac-Man akhirnya tercapai, tapi bukan oleh manusia. Maluuba- tim deep learning yang dibentuk Microsoft akhir Januari lalu- menyusun sistem kecerdasan buatann untuk mempelajari bagaimana mencapai nilai maksimum 999.900 pada Atari 2600.
Meskipun sudah terbilang klasik, Pac-Man terbilang sulit karena sulit sekali diprediksi. Banyak pemain game yang berusaha mencapai nilai maksimal, tapi sejauh ini nilai tertinggi mendekati 266.330 pada Atari 2600. Jauh dari nilai sempurna 999.900.
Periset AI memiliki kecenderungan menggunakan video game untuk menguji kemampuan belajar mesin. Mereka lebih baik meniru kekacauan dunia nyata dalam lingkungan yang terkendali versus permainan statis seperti catur. Pada tahun 2015, AI DeepMind dari Google dapat mempelajari bagaimana menguasai 49 game Atari dengan menggunakan pembelajaran penguatan, yang memberikan umpan balik positif atau negatif setiap kali AI mencoba memecahkan masalah.
Maluuba bisa menggunakan AI untuk mengalahkan permainan dengan menjalankan tanggung jawab, memecahnya menjadi pekerjaan seukuran gigitan yang ditugaskan ke lebih dari 150 agen. Tim kemudian mengajarkan AI menggunakan apa yang mereka sebut Hybrid Reward Architecture - kombinasi pembelajaran penguatan dengan metode membagi-dan-menaklukkan. Agen individu diberi tugas sedikit demi sedikit - seperti menemukan pelet tertentu - yang bekerja sama dengan agen lain untuk mencapai tujuan yang lebih besar. Maluuba kemudian menunjuk agen puncak (Microsoft menyamakan ini dengan seorang manajer senior di sebuah perusahaan) yang meminta saran dari semua agen untuk memberi tahu keputusan tentang ke mana memindahkan Pac Man.