Geoffrey Hinton

Chris Stephenson
356 Görüntüleme
16 Dk Okuma Süresi
Geoff’un Palo Alto’daki evinde yemekteyiz. Yıl 2014, Filiz Ada Stephenson, Geoff Hinton, Chris Stephenson (Fotoğraf: Barbara Stephenson).

Geoffrey Hinton, John Hopfield ile birlikte Nobel fizik ödülünü kazandı. Nobel komitesi Hopfield’ın enerji minimizasyonu yapan sinir ağını icat etmesini ve Hinton’ın bunu Boltzmann makinesi olarak geliştirmesini gerekçe gösterdi. Bu kısa notu yazmam istendi çünkü Geoff 57 yıldır benim arkadaşım.

Geoff ile ilgili ilk anım 1967 yılından. İkimiz de Cambridge Üniversitesi’ne yeni başlamıştık. Kings College’ın barında bir masanın etrafında toplanmış, birbirimizi tanımaya çalışıyorduk. Nedense birbirimize göbek adlarımızı soruyorduk. Geoff’un göbek adı “Everest” idi. Birisi, “Ah, sana dağın adını vermişler” diye tahmin etti. “Hayır” dedi Geoff, “Aslında tam tersi’. İngiliz Hindistan Sömürge İdaresi Harita Mühendisliği Bölümü Genel Başkanı George Everest, 1865 yılında görevinden emekli olduğunda, bu göreve gelen yeni Genel Başkan, emeklilik ikramiyesi olarak dağa Everest adını verdi. George Everest’in, dağa kendi adının verilmesini istemediğini ve Tibet adı Chomolunga ya da Nepal adı Sagarmatha gibi yerel bir adın kullanılmasını tercih ettiğini de bu arada söylememiz gerekir.  

Geoff, göbek adını George Everest’in yeğeni olan matematikçi Mary Everest’ten almıştır. Mary Everest daha sonra matematikçi ve sembolik mantığın mucidi George Boole ile evlenmiş ve Mary Everest Boole adını almıştır. Geoff onların çocuklarından birinin soyundan gelmektedir. Geoff’un aile ağacı sıra dışıdır; bir yanda bilim insanları ve matematikçiler, diğer yanda radikaller ve feministlerle doludur. Mary Everest Boole gibi bazıları hem matematikçi, hem de radikaldi. 

Geoff’un atalarıyla bazı ortak yönleri vardı. George Boole, üniversiteye gidecek parası olmayan bir ayakkabıcının oğluydu. Tamamen kendi kendini yetiştirmiş, matematik makaleleri yayınlamaya başlamış ve sonunda İrlanda’da yeni kurulan Cork Üniversitesi’nde Matematik Profesörü olarak görev almıştır. Tam bir profesördü ama üniversite diploması yoktu. Boole olasılık teorisi ve diferansiyel denklemler alanında önemli katkılarda bulunmuş ve ayrıca sembolik mantığı kurmuştur. Günümüzde bilgisayar programlarındaki mantıksal değerler “Boolean” olarak adlandırılmaktadır. Diferansiyel denklemler ve mantık üzerine çalışmalardaki ortak nokta, ‘mantıksal değerler cebiri’ ya da türev operatörü gibi ‘operatörler cebiri’ gibi soyut bir sistem yaratma fikriydi. Soyut sistemin kuralları bir kez oluşturulduktan sonra, soyut sistem, modelledikleri temel nesneler açısından incelenebilirdi. Bu fikir günümüzde de yaygındır. Fizikteki temel parçacıkların Grup Teorisi kullanılarak incelenebilmesini ve grupların permütasyon veya rotasyonları modellemek için de kullanılabilmesini garip bulmuyoruz. Bu, Boole’un zamanında çok radikal bir fikirdi.

Geoff üniversiteye gitti ama geleneksel bir öğrenci olmaktan çok uzaktı. Daha lisans öğrencisiyken insan beyninin nasıl çalıştığını bulmaya kafayı takmıştı.  Beş ya da daha fazla kez bölüm değiştirdi. Fizik, Kimya, Matematik, Mimarlık (bu tam olarak bir gün sürdü), sonra Fizik ve Fizyoloji birlikte, sonra Felsefe ve son olarak da Psikoloji okudu. Bunu, beynin nasıl çalıştığını bulmak için bölümden bölüme geçme süreci olarak tanımladı. Hocaların parlak zekalarına ve bilimsel itibarlarına rağmen, fizyologların beynin nasıl çalıştığını bilmediği, felsefecilerin de bilmediği ve psikologların tamamen bilgisiz olduğu sonucuna vardı. 

Mezun olduktan kısa bir süre sonra Edinburgh Üniversitesi Makine Zekası Bölümü’nde lisansüstü sınıf arkadaşıydık. “Yapay Zeka” ismi yerine “Makine Zekası” ismi kullanılıyordu. Ayrıca ev arkadaşı olduk. Bölümün başında İkinci Dünya Savaşı sırasında Bletchley Park şifre kırma merkezinde Alan Turing’in iş arkadaşı olan Donald Michie vardı. Geoff’un doktora danışmanı Christopher Longuet-Higgins’ti. Longuet-Higgins çok üretken bir teorik kimyacıydı ve diğer şeylerin yanı sıra grup teorisini moleküler simetriye uyguluyordu. Birçok kişi tarafından, çalışmalarıyla ilgili Nobel ödülü alamadığı için çok şanssız olduğu düşünülüyordu. 1967’den sonra yapay zeka araştırmaları yapmak için kimyayı bıraktı. Longuet-Higgins’in ilgisini çeken görevlerden biri, müzik dinleyebilecek ve insanlar için kolay bir şey olan müzik ölçüsünü belirleyebilecek bir program yapmaktı. Mutfağında mekanik bir ayak bulunduruyordu, böylece program nihayet geliştirildiğinde bir insan gibi müziğe zamanında dokunabilecekti. Yapay zeka için bu zor bir görev olmaya devam ediyor. Şu anda mevcut olan uygulamalar hala sık sık hata yapıyor.

Longuet-Higgins daha önce sinir ağlarıyla ilgilenmiş, ancak Geoff doktora öğrencisi olduğunda, o zamanlar daha popüler hale gelen sembolik yaklaşımlar için onları terk etmişti. Longuet-Higgins, Geoff’un sembolik mantık tabanlı yapay zekaya geçmesi gerektiğini düşünüyordu. Böylece Geoff doktora çalışmalarının tamamını danışmanıyla yoğun bir şekilde tartışarak geçirdi.    

Geoff doktorasını 1977’de tamamladı. Ancak, Birleşik Krallık hükümeti Yapay Zekanın geleceğini araştırması için Profesör Lighthill’i görevlendirmişti. Lighthill’in raporu yapay zekânın bir geleceği olmadığını söylüyordu. Birleşik Krallık’taki neredeyse tüm yapay zeka araştırmaları durduruldu. Bundan sonra Geoff İngiltere’de iş ya da araştırma bursu bulamadı. Bir iş görüşmesi bile yapamadı. Önce San Diego’daki Kaliforniya Üniversitesi’ne, ardından da ABD’deki Carnegie Mellon’a taşındı. 

Carnegie Mellon’a gitmeden önce, hiç tanımadığı biri tarafından kendisine ulaşıldı ve araştırması için fon teklif edildi. Bir araştırma fonu başvurusunda bulundu ve onun talep ettiğinden daha fazla para verdiler. Paranın Rand Corporation’ın fazla kârlarından kurtulmak için kurduğu bir hayır kurumundan geldiği ortaya çıktı. Rand Corporation, ABD Savunma Bakanlığı için çok sayıda danışmanlık ve geliştirme işi yapan kar amacı gütmeyen bir kuruluş. Geoff, Savunma Bakanlığı’ndan dolaylı da olsa para almaktan çok rahatsızdı. Bunun yapay zekanın iyi olmayan amaçlar için kullanılmasına yol açabileceğini düşünüyordu. İlk bursu aldı ama daha fazlasını almak istemedi. Toronto Üniversitesi’nde finanse edilen bir araştırma pozisyonu bulabildi. Kanada’da ise kaynağı askeriyeden gelen bir para almak zorunda değildi. 1990’larda hem Toronto Üniversitesi’nde Profesörlüğe kavuşacaktı, hem İngiltere’den “Fellow of the Royal Society” ünvanına sahip olacaktı, babası gibi. Bu arada, Royal Society’nin ilk başkanının Isaac Newton olduğunu belirtelim.

1980’lerde yapay zeka o kadar sevimsiz ve demode hale gelmişti ki, araştırmacılar yayınlarına “Yapay Zeka” kelimelerini içermeyen başlıklar vererek çalışmalarını kamufle ediyorlardı. Araştırmacılar bu kelimelerin araştırma bursu başvurularının reddedilmesine ve yayınlarda zorluklara yol açacağını düşünüyorlardı. Hinton’un Boltzmann makinelerini tanımladığı en eski makale 1986’da yayınlanmış ve Boltzmann makinelerini “kısıtlama tatmin ağları” olarak tanımlamıştı. Makale 1986 yılında yayımlanan “Parallel Distributed Processing” adlı kitapta yer aldı. Kitaptaki 13 makalenin dört tanesinde Hinton ortak yazar olarak bulunuyor. Koleksiyondaki makalelerin hiçbirinin başlığında yapay sinir ağları ya da yapay zekâdan bahsedilmezken, Boltzmann makineleri Geoff’a Nobel ödülünün verilmesine neden olan yenilik olarak gösterilmektedir.

Geoff sonraki 20 yıl ve daha uzun bir süre boyunca bu pek de popüler olmayan alanda çalışmaya devam etti. “Derin Öğrenme” konusunda bazen 20-30 kişinin katıldığı yaz okulları düzenledi. Sinir ağlarını gerçekten çalışır hale getirmenin yollarını ararken yüzlerce makale yayınladı. Beynin fiziksel yapısını taklit eden gerçek sinir ağları hiçbir zaman inşa edilemedi. Ağların, insan beyni gibi kitlesel olarak paralel bir şekilde değil, verileri her seferinde bir öğe olarak işleyen dijital bilgisayarlarda simüle edilmesi gerekiyordu. Amaç, verilerle beslenerek eğitilebilen ve verilerdeki örüntüleri, örüntülerin ne olduğu ya da ne anlama geldiği belirtilmeden öğrenebilen ağlar inşa etmekti. 

Bu uzun dönemden sonra bir şeyler değişti. Bilgisayarlar giderek büyüyor, hızlanıyor ve ucuzluyordu. 1986 yılında bir IBM PC-AT 6MHz hızında çalışan bir işlemciye, 512 KiB maksimum RAM boyutuna ve 20 MiB maksimum sabit disk boyutuna sahipti. Bunu yazdığım 2010 model eski dizüstü bilgisayarda 3.4 GHz hızında çalışan çift çekirdekli bir işlemci, 16 GiB RAM ve 4 TB kapasiteli hızlı bir SSD disk var. Bir 1986 PC’sinden 1000 kat daha hızlı, 32000 kat daha fazla RAM’e ve 200.000 kat daha fazla ikincil depolama alanına sahip. Aynı zamanda bilgisayarlar ucuzladı, yani sinir ağlarını simüle etmek için çok daha fazla bilgisayar gücü tahsis etmek mümkün oldu. Geoff, Yapay Sinir Ağlarını uygulanabilir hale getirdiği için bilgisayar kapasitesindeki değişikliklere güveniyordu. İkincil belleğin (sabit diskler) ekstra boyutu, sinir ağlarının giderek daha fazla veri üzerinde eğitilebileceği anlamına geliyordu ve artan işlemci hızı ve RAM boyutu, bu verilerin hızlı bir şekilde işlenebileceği anlamına geliyordu. Son olarak, World Wide Web’in yaygınlaşması, sinir ağlarını eğitmek amacıyla toplanabilecek muazzam miktarda veriye erişim sağladı. Bu aynı zamanda on binlerce güçlü bilgisayarın paralel olarak çalışacağı devasa sunucu çiftliklerinin kurulmasını da sağladı. Bilgisayar gücünün giderek artan kullanılabilirliği Yapay Sinir ağlarını bir dönüm noktasına taşımak üzereydi.

2012’de bir dizi dönüm noktası yaşandı. Konuşma tanımada, Derin Sinir Ağları önceki tüm yaklaşımlardan daha iyi performans göstermeye başladı, Bu sonuç Geoff Hinton’ın ortak yazarlığını yaptığı IEEE Signal Processing’deki bir makalede rapor edildi. Aynı yıl, Geoff’un doktora öğrencilerinden Alex Krizhevsky, ImageNet’te depolanan görüntüleri tanımaya yönelik bir yarışmaya bir Sinir Ağı sundu. Bu ağ, rakipleri ve selefleri tarafından elde edilen görüntü tanıma hata oranını yarıya indirerek %30’dan %15’e düşürdü. Ayrıca ekip, modeli tersten çalıştırıp girdi olarak “kedi” verdiğinde, model, arzu edildiği gibi, ortalama bir kedi resmi üretebildi. Popüler beğeniye epey hitap eden, epey göz alıcı bir marifetti bu.

Aynı dönemde Geoff’un bir öğrencisi Google’da staj yaptı ve Google’ın konuşma tanıyıcısının bir kısmını bir sinir ağı modeliyle değiştirdi. Mevcut konuşma tanıyıcıdan daha iyi çalışıyordu. Böylece Android sistemine yerleştirildi. Sonuç olarak, Android bir süre için Apple’ın Siri’sinden daha iyi bir konuşma tanıyıcıya sahip oldu. Apple benzer bir başarıyı yakalamak için daha sonra epey uğraşmak zorunda kaldı. 2013 yılında Google, Geoff’tan kendileriyle çalışmasını istedi ve Geoff zamanını Google ve Toronto Üniversitesi arasında bölüştürmeye başladı; her birinde yılda altı ay çalışıyordu.

Sinir ağlarının artan pratik başarısına rağmen, Geoff hala bilimsel dergilerde araştırma makalelerini yayınlamakta zorluk çekiyordu. 2014 yılında “Dark Knowledge Distillation” üzerine yazdığı makalesinin reddedilmesini protesto ederek, bu makaleyi resmi olmayan arxiv.org sitesinde yayınladı. Bu makale hala sadece arxiv.org’da bulunuyor; başka herhangi bir bilimsel dergi tarafından yayınlanmamış durumda. Geoff’un arxiv.org’a koyduğu bir başka makale, ancak alandaki neredeyse herkes onun burada önerdiği yöntemleri kullandıktan sonra yayınlanmak üzere kabul edildi.

Bu dönemde tüm büyük şirketler yapay zeka araştırmalarına ve giderek daha fazla bilgisayar gücü kullanarak ve giderek artan miktarda eğitim verisini işleyerek, daha büyük ve daha büyük ağlar kurmaya yönelik yatırımlarını artırmak için acele ettiler. Bu da ağların performansındaki gelişmeler üzerinde kartopu etkisi yarattı. On yıl sonra, çok büyük sinir ağlarının etkileyici yeteneklerine herkesin erişimini sağlayan ChatGPT ve Dall-E’ye sahibiz.

Geoff, yeni teorileri test etmek için Google’da elinin altında bulunan devasa kaynakların keyfini çıkardı. Bir keresinde bana Google’da başka bir araştırmacıyla anlaşmazlık yaşadığını ve kimin haklı olduğunu test etmek için sonuç üzerine bir dolara bahse girdiklerini söyledi. Deney, hafta sonu boyunca on binlerce bilgisayarın çalışmasını içeriyordu. İddiayı sonuçlandırdılar ve ardından sorularını yanıtlamak için kullandıkları elektrik miktarını hesapladılar. Küçük bir kasabaya yetecek kadar elektrik kullanmışlardı.

Bu deney, Yapay Sinir Ağı tabanlı yapay zeka patlamasıyla ilgili ortaya çıkan sorunlardan birine bir örnektir. Genel olarak büyük teknoloji, özellikle sinir ağlarının diğer bilgi işlem türlerinden çok daha fazla enerji kullandığı gerçeğinden hareketle daha fazla elektrik enerjisine aç olması. Yapay zeka ile ilgili diğer sorunlardan bir diğeri, internetteki kaynaklardan besleniyor olması ile ilgili. Google etik bölümü araştırmacılarından Timnit Gebru, Büyük Dil Modellerinin içerdiği ırkçılığı tespit etti ve bulgularını yayınladı. 2020 yılının sonuna doğru Gebru işten atıldı. 2020 yılında Geoff bu konuda sessiz kaldı. Ancak 2023 Mayıs ayında Geoff da Google’dan istifa etti. Yapay zekanın tehlikeleri konusunda uyarılarını ifade etmek için özgür olmak istiyordu. Kendi hedeflerini belirleyebilen ve insanlardan daha zeki hale gelebilecek olan Yapay Zeka sistemlerinin ortaya çıkışı konusunda endişelendiğini söyledi. Yapay Zekanın “kötü aktörler” tarafından tehlikeli bir şekilde kullanılması olasılığını gündeme getirdi. Kendi hedeflerini belirleyebilen ve silah sistemlerine erişimi olan bir Yapay Zeka sistemi, insanlara hükmetmeye başlayabilir.

Geoff istifası sırasında Google’ın Yapay Zekanın riskleri konusunda sorumlu davrandığını düşündüğünü belirtmiştir. Timnit Gebru tarafından dile getirilen itirazlar sorulduğunda, Gebru’nun ortaya koyduğu sorunların, kendi endişeleri kadar birincil, “varoluşsal riskler”le ilgili olmadığını düşündüğünü söyledi.

Ancak, artık bir Google çalışanı olmanın getirdiği kısıtlamalardan kurtulan Geoff’un son zamanlardaki yorumları daha radikal hale geldi. Bir röportajında, yapay zekanın insanlığa bir lanetten ziyade gerçekten bir fayda sağlayabilmesi için toplumdaki güç ve zenginlik farklılıklarını ortadan kaldırmamız ve “bir tür sosyalizme” sahip olmamız gerektiğini söyledi. Tıbbi görüntüleme ve verilerin analizi gibi bazı uygulamalar yapay zeka için idealdir. Ancak, diğer uygulamalar, öncelikleri insan refahından ziyade kâr olan elitlerin elinde tehlikeli olabilir. İşverenleri çalışanlarına karşı güçlendirmek bir örnektir, silahlı kuvvetler tarafından Yapay Zeka kullanımı başka bir örnektir.

Geoff’un askeri kullanımla ilgili endişelerinin 1980’lere dayandığını ve bugün daha da geçerli olduğunu eklemeliyim, ancak kendisi spesifik örnekler hakkında açıkça konuşmuş değil. 

Nihayetinde, Geoff’un kariyeri, önce ACM tarafından verilen Turing Ödülü ve şimdi de Nobel Fizik Ödülü ile taçlandırıldı. Pek çok kişi bu çalışmanın neden Fizik ödülüne layık görüldüğünü anlamakta güçlük çekiyor. Geoff’un kendisi de bunu garip buluyor. Tek gerçek bağlantı, Boltzmann ile. Boltzmann, istatistiksel ve olasılıksal yöntemleri fiziğe sokmak için mücadele etmek zorunda kalan bir fizikçiydi. Boltzmann kendi fikirlerinin zaferini göremeden intihar etti. Geoff, yapay zekaya sembolik mantıksal yaklaşım yerine istatistiksel yaklaşım getirmek için hayatı boyunca mücadele etti. Geoff fikirlerinin zaferini gördü; ancak bu, iki pişmanlıkla dolu bir zaferdi. Geoff insan beyninin nasıl çalıştığını öğrenmek istiyordu, ancak mevcut yapay ağların insan beynine hiçbir şekilde benzediğine inanmıyor. Geoff, “Bilim her seferinde bir cenaze ile ilerler” diyen Max Planck’tan alıntı yapıyor. Yeni fikirlerin ortaya çıkabilmesi için eski bilim insanlarının ölmesi gerekir. Bilim kurumunun tutuculuğuna yönelik bu eleştiri, Geoff’un fikirlerini kabul ettirmek için verdiği mücadeleye de uygulanabilir. Ancak Geoff, insan zekasının gerçek anlamda anlaşılabilmesi için önce kendi fikirlerinin yıkılması gerektiğinden bahsediyordu. Öte yandan, yapay sinir ağları artık etkileyici sonuçlar üretiyor. Ancak, Geoff’un da belirttiği gibi, köklü bir sosyal değişim olmadan, insanlık için net sonuç olumlu olmayacaktır.

Bu Makaleyi Paylaşın