Bu yazı Flaps Club ve CogIST arasında 2020-2021 boyunca gerçekleşen
FLAPSHIP iş birliği bağlamında yayınlanmıştır.

Eylem gözlemi ve algısı, insanların içinde yaşadıkları çevreyi anlamaları için çok önemlidir. Bu gözlem sırasında, insan sosyal bir varlık olduğu için, insan hareketlerinin anlamını bir ölçüde sosyal bilişiyle ölçer [1]. Sosyal biliş bileşenlerinden biri zihinselleştirmedir. Zihinselleştirme ya da zihin teorisi (Theory of Mind), bir “zihne sahip olmanın” bir nesneye ya da özneye ait olup olmadığına karar verme ve etiketleme mekanizmasıdır [2]. Yani bu yetenek bir objeye baktığımızda cansız bir obje ise akla sahip olmayacağını fakat bir obje canlıysa niyeti, istekleri veya düşünme yetisi olabileceğine karar vermemize yarıyor. Bunu yapmak için zihinsel bir sürece girmesi gerekir ve bu noktada Zihin Algısı (Mind Perception) adlı başka bir bileşene bağlanır. Bu, nesneye veya özneye zihin olarak atfedilebilecek iç mekanizmaları, nesnenin veya öznenin hareketinden ve görünüşünden algılama yeteneğidir [3]. Bu yazıda zihin algısının oluşabilmesi için bir insanın hangi hareket ve görsel bilgilere ihtiyacı olduğunu tartışıp, bu verilerin senkronize olmanın, objeye veya özneye zihinselleştirme yapılabilmesi açısından önemi üzerinde duracağım. Bu tartışmanın şimdilik yalnızca pratik kısmına değinip, felsefi yanını konu etmeyeceğim. Ayrıca, bu bağlamda yeni gelişen teknolojiyle paralel giden sosyal robotların dizaynın, yani bizimle etkileşime giren robotların görünümünün ve davranışlarının, robotların zihin sahibi olmasında bir etkisi olacak mı bunu tartışacağım.

 

Bir objenin veya öznenin zihne sahip olduğuna karar verebilmemiz için öncül olan şey hareketlerinin ve görüntüsünün bizim için sosyal anlamda bir şeyler ifade edebilmesidir. Peki bu durum canlı ve cansız olmasından bağımsız da gözlemlenebilir mi? Yani bir cansız obje insansı görüntüye sahip olduğu için ya da hareketleri insan hareketleriyle senkronize durduğu için bir “zihne” sahip olabilir mi? Yani, robotların bir zihni olabileceğine gerçekten inanmamız mümkün müdür? 

 

1950 yılında ünlü matematikçi ve bilgisayar bilimci Alan Turing bir makinenin düşünce süreçlerinden geçip geçemeyeceğini insan gözünden değerlendiren bir düşünce deneyi tasarlamış oldu [4]. Bu testin nihai amacı bir makinenin düşünebildiğini düşünmenin mümkün olup olmadığını anlamaktır. Bu teste göre gönüllü sorgulayıcı insan, makine ve başka bir gönüllü ile yazışmalar eşliğinde interaktif bir etkileşime geçecektir. Özneler birbirini göremeyecek yerlere yerleşir. Sorgulayıcı sadece sorularını diğer öznelere klavye ve ekran üzerinden yöneltecek ve cevapları bilgisayar ekranından görecek biçimde özneye dair hiçbir sesli veya görsel bilgi olmadan elde edecektir. Sorguluyacının gelen cevaplara göre öznelerin hangisinin bir makine, diğerinin insan olduğuna karar vermesi gerekir. Sorgulayıcının elinde soru cevap dışında öznelere dair elde ettiği başka bir bilgi yoktur. Bloklar halinde yapılan bu testin sonunda sorgulayıcı özne olan insanı tekrarlı bir biçimde saptayamazsa, hangisinin makine hangisinin insan olduğuna karar vermede tutarlılık olmazsa, makine Turing testini geçmiş olur. İnsan tarafından sorulan sorulara “mantık” doğrultusunda cevap verdiği sürece ve tutarlılığı koruduğunda bu testin geçilebileceğini Alan Turing tartışmıştır. Bugün bilgisayar programları çok kısa bir süre olsa da Turing testini geçebiliyorlar. Bunu sohbet botları adıyla aslında bir bilgisayar algoritmasıyla konuşan sohbet sayfalarında görebiliyoruz. Buradaki önemli olan şey, bu algoritmalar iletişimdeki davranışların özelliklerini taklit ederek, bu sohbet robotlarının insanlar tarafında zihinleri varmışcasına algılanmasını sağlıyor. Fakat, bilgisayarın ürettiği bu algoritma bir insanı konuşmada kandırarak aslında kısa süreli bir inanç ürettikleri söylenebilir. Beyin kısa girdilerle doğruluğa ulaşmak için gelişen bir organ olmadığı için bu uçucu kandırma kolay gerçekleşebilir. Önemli olan şey aslında uzun vadede algı sistemine tutarlı girdiler vererek bir geçerli çıktı almak olacaktır. İşte bu noktada fiziksel olarak karşıdaki objenin hareketleri ve görünümü üzerinde durmak insan algısına uzun vadede giden yol olacaktır.

 

Karşımızdaki objenin eylemlerinin anlamlı olması bizim davranışlarımız ve o objeye dair muhakeme yapmamız için önemlidir. Eylemler mantıklı değilse, muhtemelen şanstan oluşan bir hareket dizisi olarak görülecektir. Böyle düşünüldüğünde şanstan oluşan davranışlar sosyal bağlamda değerlendirilmez fakat, eğer davranışlar bir anlam ifade etmeye başlarsa o zaman bu objeyle bilişsel anlamda bir bağ kurulabileceği anlaşılır. 

 

Nesnenin veya öznenin zihnini belirlemek ve başka bir varlığın zihninin öngörülebilirliği ile bağlantı kurmak mümkündür. Bu yetenek için örtük ve açık bilişsel mekanizmalar kullanılmaktadır. Örneğin, konuşma becerisini kullanan bir obje veya özne bir ölçüde düşünebilen bir zihne sahip olduğunu bize göstermiş olur. Bu sırada onun bize yolladığı sinyalleri içsel olarak işlerken örtük mekanizmalar kullanılır, mesela gönderdiği ses dalgalarını işleyen beyin bölümlerinin işlevleri ya da dediklerine hak verip vermemiz için çalışan karar verme mekanizmaları gibi. Karşı tarafın bize yolladığı sinyalleri anlamak için, diğer tarafın varlığı açısından görüleni simüle etmek ve bu açıdan “görmek” gerekir. Yani, kişinin kendisini ‘karşı tarafın yerine koyması’ ve onun perspektifinden ne görülüyorsa, onu görmesi, tahmin etmesi, çıkarsaması gerekir. Başarılı bir sosyal etkileşim bize diğer varlıkların deneyimlediği mekanizmaları dinamik olarak gösterir ve yolladığı sinyalleri “eylemlerini ve niyetini okumaya” yardımcı olur. Bu okuma işinin somutlaştırılmasına “eşzamanlı gözlem (synchronous observing)” denir [5-6]. Bu eş zamanlı izleme, hareketlerin anlamını belirlemede bize çok yardımcı olur. Çünkü bildiğimiz davranışları sergilemesi karşıdaki objenin zihnini anlamada bizim adımıza faydalı olacaktır. Senkron davranışlar, insanların diğer konularda aradığı güdüsel bir özellik olarak görülebilir. Çünkü insana özgü davranışların eşzamanlı iletimi, mesajı karşı tarafa aktarıldığını ve karşı tarafın algı mekanizmasının aynı ya da benzer olduğunu bize gösterir. Bu nedenle, iç mekanizmanın bir çıktısı olan insansı davranışlar, insanlar tarafından “bana benzer” şeklinde algılanma eğilimindedir. 

 

Yüz algısı da senkronize olma bağlamında oldukça önemlidir, objenin çekiciliğini,  güvenilirliğini hatta zihinsel yapısını eğer aşina olduğumuz şekildeyse, bize sunar. Yüzler, diğer beden uzuvlarından daha hızlı dikkat çeker ve beyin içinde hızlı bir elektro kortikal tepki uyandırır [7]. Doğada diğer desenlerden farklı olarak, insan yüzüne ve insan yüzüne benzeyen kombinasyonlar algı açısından önemlidir ve algılanması diğer nesnelerden çok daha hızlı gerçekleşir, ki bu girdiyi potansiyel bir yüz olarak işaretleyen hızlı bir desen eşleştirme mekanizması olduğunu düşündürmektedir (the rapid pattern-matching mechanism) [8-9]. Bu mekanizma sayesinde antropomorfik tepkiler verebilir ve anlık olarak bir arabanın veya kahvenin baloncuklarının gülen bir yüze sahip olduğu düşünülebilir.  

 

Fakat yine de gülen bir yüze sahip bu objelerin canlı olmadıklarını biliyoruz. Hatta robotların bilinçli dizayn edilmiş yüzleri olmasına rağmen halen onlara alenen akıl atfetmeyiz. Bu yüzlerin zihinsel modellerimize layık olmadığını nereden biliyoruz? Cevabın bir kısmı açık: akılsız yüzler genellikle hareketsizdir.  Wheatley, Weinberg, Looser, Moran ve Hajcak (2011) tarafından yapılan araştırmada insan, bebek ve robot yüzü olan görüntüler katılımcılara izletildi, ve görüntüler izlenirken elektro kortikal kayıtlar alındı [10]. Tüm yüzler katılımcıları algılama düzeyinde uyarırken (to stimulate) sadece insan yüzleri daha sonra devam eden bir dalga formuna 400 ms gecikme ile yol açtı. Bu bulgu yüzleri tespit ettikten sonra objede zihin algısı için ikincil derece de bir inceleme olduğunu göstermektedir. Bu iddiayı gösterebilmek için başka bir deney düzeneği ile katılımcılara animasyonlarla insan yüzlerinden avatarlara doğru evrilen bir dizi morph  (animasyonlarda kullanılan dizi dizi sahne denilebilir) görüntüsü gösterildi. Katılımcılar ilk kez ne zaman “zihni var” diye işaretlemesi istendiğinde %65 düzeyinde insan yüzüne yakın olan animasyonu seçti. Bunun açıklaması olarak ise katılımcılar bu noktayı, yüzün onlara geri baktığı ilk an olarak tanımladı [11]. Yüz açısından Turing Testini geçmek sadece bir yüzün varlığını değil, aynı zamanda “orada biri var ve iletişime açık” şeklinde algılanmasını gerektirir.

 

Peki hareket algısına geri döndüğümüzde bizi ne bekliyor? Heider ve Simmel 1944 yılında hareketin zihin algısına etkisi üzerine yaptığı deneyde üç geometrik obje kullamıştı [12]. İnsansı bir görünüme sahip olmayan bu şekillerin davranışlarında sadece zihinsel aktiviteye dair ipuçları içeren örüntüler mevcuttu. Katılımcılar objelerin zihinsel durumlarını nitelendirme de bu aktivitelerin olabileceğine dair pozitif dönütler verdi ve o günden beri araştırmalarda bu tür uyaranlar kullanıldığında benzer sonuçlar elde ediliyor. Fakat hareketin de sadece kendisi yeterli değildir. Hareketlerini yeterli düzeyde insansı tuttuğumuzda bile basit bir robotun Turing testini hala geçemediğini bilebiliyoruz. Fakat testi geçemese de bu davranışların belli düzeyde antropomorfik uyarımlarda bulunduğunu biliyoruz. 

 

Bu bir dereceye kadar davranışın anlamlı olmasıyla alakalıdır. [13]. Bir özne, insan davranışları gösteriyorsa, insan zihnini buna göre bağlamlandırabiliriz. Bu tahmin mekanizması, gözlemlenen davranışın uyumu ve anlamlılığı ile sağlanır. Bu bağlamda, hareket ve zihin algısı üzerine, hareketin hız ve anlamlarının zihin algısını nasıl arttırdığını / azalttığını ölçmek için de bir dizi araştırma yapılmıştır [14-18]. Bu çalışmalarla, kişinin karşılaştığı nesne veya konunun davranışındaki ipuçlarını izleyerek zihin algısını yarattığı gösterilmiştir. Bu bulgular bazı araştırmacıların bu hareket ipuçlarına dayanarak özne tespitinin zihinsel anlayışın öncüsü olduğunu ileri sürmesine neden olmuştur [19]. Daha spesifik olarak, sosyal hareketleri anlamada etkili olan korteksin, geometrik ve cansız nesneler, hatta insan temelli desen taşımayan nesneler bile, birbirini takip etme, karşılık verme veya konuşma gibi sosyal davranışlarda bulunduklarında da aktive olduğu bulunmuştur [20-22]. Paralel olarak, aynı şekillerin hareketleri rastgele ve düzgün olmayan bir düzen ile  gözlemlendiğinde, cansız nesneler için çalışan korteksin aktif olduğu görülür [22-23]. Böylece, sosyal veya insan örüntüleri sergileyen hareketin bize nesnenin bir zihni olup olmadığı konusunda içsel cevaplar verdiğini anlayabiliriz.

 

İnsan sosyal bir varlıktır ve bu sosyalliği sayesinde çevresindeki objeleri de buna göre düzenler. Bu gerçek sayesinde çevresindeki objelerle durmadan bir etkileşime geçer, beklenti ve tahmin yetekleneklerini durumlara adapte eder. İnsanların bir zihin için bekledikleri anlık “zihinsel olarak birleşme, aynı zihinsel frekansa girme anı” bu beklenti ve tahminin uyuşmasıyla bağlıdır. Aynı iç frekansa ayarlanmış gibi, zahmetsiz konuşmaya girerler, duyguların aynı yükselişini ve düşüşünü yaşarlar ve bir iletişim sırasında diğerinin düşüncelerini bitirebileceğini hissederler. Bu zihinsel olarak bağlanma anının nedeni bilinmese de, senkronize örüntüler göstermenin bu anlamda oldukça önemi olduğunu biliyoruz. Senkronizasyon, işlevsel olarak benzer olmanın bir işareti olarak görülebilir. Bu bağlamda robotları düşündüğümüzde beklenti ve tahmin yetenekleri senkronize olmada insanda oldukça adaptif görünecektir.  Çünkü robotların günümüz dizaynında zaten insan algısını baz alarak geliştirilmesi, bu beklenti ve tahmin süreçlerine bir noktada hizmet ediyor. Yani bir robotun insan için içsel durumlara sahip olabileceği bir senaryo oldukça muhtemel bir şekilde geliştiriliyor. Fakat halen bu tam oluşabilmiş değil. Aslında insan zihni üzerine olan çalışmalar neyi ne ölçüde beklediğimizi ve nasıl bir tahmin geliştirdiğimizi ortaya koyuyor. Robotların da bir zihne sahip olduğunu düşüneceğimiz zaman aslında bu senkronizasyona sadece dış görünüş değil de hareketlerin de bu dış görünüşle paralel gittiği bir gelecek düşünmek gerekiyor.  Eğer hareket ve görsel verileri yeterli oranda senkronize edip tutarlı bir döngü sağlayabilirsek gelecekte robotların bir miktar bile olsa zihninin olduğuna inanmak, antropomorfik bir tepkiden ziyade, oldukça olası bir gerçeklik olarak hayatımıza girmiş olacak.

Bilkent Üniversitesi Psikoloji Bölümü’nden mezun olduktan sonra, aynı üniversitede Nörobilim Yüksek Lisans Programı’na devam ediyor. Zihin algısı ve sosyal robotlar üzerine çalışıyor.

İstanbul Üniversitesi Dilbilimi Bölümü son sınıf öğrencisi olarak lisans eğitimine devam ediyor. Yüksek lisansında insan belleğinin işlemsel modelleri üzerine çalışmak istiyor.

Isaac Asimov — Ben Robot kitap kapağı, İthaki Yayınları, İstanbul.

  • Fiske, S. T., & Taylor, S. E. (1991). Social cognition. Mcgraw-Hill Book Company.
  • Baron-Cohen, S., Leslie, A. M., & Frith, U. (1985). Does the autistic child have a “theory of mind”. Cognition, 21(1), 37-46.
  • Gray, H. M., Gray, K., & Wegner, D. M. (2007). Dimensions of mind perception. science, 315(5812), 619-619.
  • Turing, I. B. A. (1950). Computing machinery and intelligence-AM Turing. Mind, 59(236), 433.
  • Semin, G. R., & Cacioppo, J. T. (2008). Grounding social cognition: Synchronization, entrainment, and coordination. Embodied grounding: Social, cognitive, affective, and neuroscientific approaches, 119-147.
  • Semin, G. R., & Cacioppo, J. T. (2009). From embodied representation to co-regulation. In J. A. Pineda (Ed.), Mirror Neuron Systems, pp. 107–120. New York, NY: Humana Press. doi: 10.1007/978-1-59745-579-7_5.
  • Langton, S. R. H., Law, A. S., Burton, A. M., & Schweinberger, S. R. (2008). Attention capture by faces. Cognition, 107, 330–342. doi: 10.1016/j.cognition.2007.07.012.
  • Jacques, C., & Rossion, B. (2010). Misaligning face halves increases and delays the N170 specifically for upright faces: Implications for the nature of early face representations. Brain Research, 1318, 96–109. doi: 10.1016/j.brainres. 2009.12.070.
  • Sagiv, N., & Bentin, S. (2001). Structural encoding of human and schematic faces: holistic and part-based processes. Journal of cognitive neuroscience, 13(7), 937-951.
  • Wheatley, T., Weinberg, A., Looser, C., Moran, T., & Hajcak, G. (2011). Mind perception: Real but not artificial faces sustain neural activity beyond the N170/VPP. PloS one, 6(3).
  • Looser, C. E., & Wheatley, T. (2010). The tipping point of animacy: How, when, and where we perceive life in a face. Psychological science, 21(12), 1854-1862.
  • Heider, F., & Simmel, M. (1944). An experimental study of apparent behavior. The American journal of psychology, 57(2), 243-259.
  • Waytz, A., Cacioppo, J., & Epley, N. (2010). Who sees human? The stability and importance of individual differences in anthropomorphism. Perspectives on Psychological Science, 5(3), 219-232.
  • Cicchino, J. B., Aslin, R. N., & Rakison, D. H. (2011). Correspondences between what infants see and know about causal and self-propelled motion. Cognition, 118(2), 171-192.
  • Tremoulet, P. D., & Feldman, J. (2000). Perception of animacy from the motion of a single object. Perception, 29(8), 943-951.
  • Blakemore, S-J., Boyer, P., Pachot-Clouard, M., Meltzoff, A., Segebarth, C., & Decety, J. (2003). The detection of contingency and animacy from simple animations in the human brain. Cerebral Cortex, 13, 837–844. doi: 10.1093/cercor/13.8.837.
  • Scholl, B. J., & Tremoulet, P. D. (2000). Perceptual causality and animacy. Trends in cognitive sciences, 4(8), 299-309. 
  • Gao, T., McCarthy, G., & Scholl, B. J. (2010). The wolfpack effect: Perception of animacy irresistibly influences interactive behavior. Psychological Science, 21, 1845–1853. doi:10.1177/0956797610388814.
  • Blakemore, S-J., Boyer, P., Pachot-Clouard, M., Meltzoff, A., Segebarth, C., & Decety, J. (2003). The detection of contingency and animacy from simple animations in the human brain. Cerebral Cortex, 13, 837–844. doi: 10.1093/cercor/13.8.837.
  • Castelli, F., Frith, C., Happe´, F., & Frith, U. (2002). Autism, Asperger syndrome and brain mechanisms for the attribution of mental states to animated shapes. Brain, 125, 1839–1849. doi: 10.1093/brain/awf189.
  • Gobbini, M. I., Koralek, A. C., Bryan, R. E., Montgomery, K. J., & Haxby, J. V. (2007). Two takes on the social brain: a comparison of theory of mind tasks. Journal of cognitive neuroscience, 19(11), 1803-1814.
  • Martin, A, & Weisberg, J. (2003). Neural foundations for understanding social and mechanical concepts. Cognitive Neuropsychology, 20, 575–587. doi: 10.1080/02643290342000005.
  • Beauchamp, M. S., Lee, K. E., Haxby, J. V., & Martin, A. (2003). FMRI responses to video and point-light displays of moving humans and manipulable objects. Journal of cognitive neuroscience, 15(7), 991-1001.
  • Apperly, I. (2012). Mindreaders: The Cognitive Basis of “Theory of Mind” (1st ed.). Psychology Press.
  • Bruce, V., & Young, A. (2013). Face Perception. Taylor & Francis.
  • Epley, N., & Waytz, A. (2010). Mind Perception. In S. T. Fiske, G. Lindzey, & D. T. Gilbert (Eds.), Handbook of Social Psychology (5th ed., pp. 498–541). John Wiley & Sons, Inc.
  • Gardner, T., Goulden, N., & Cross, E. S. (2015). Dynamic Modulation of the Action Observation Network by Movement Familiarity. Journal of Neuroscience, 35(4), 1561–1572. https://doi.org/10.1523/jneurosci.2942-14.2015
  • Goldman, A. I. (2012). Theory of Mind. Oxford Handbooks Online, 1. https://doi.org/10.1093/oxfordhb/9780195309799.013.0017
  • Hofree, G., Urgen, B. A., Winkielman, P., & Saygin, A. P. (2015). Observation and imitation of actions performed by humans, androids, and robots: an EMG study. Frontiers in Human Neuroscience, 9, 1–14. https://doi.org/10.3389/fnhum.2015.00364
  • Johnson, K., & Shiffrar, M. (2012). People Watching. Oxford University Press.
  • Ürgen, B. A., Plank, M., Ishiguro, H., Poizner, H., & Saygın, A. P. (2013). EEG theta and Mu oscillations during perception of human and robot actions. Frontiers in Neurorobotics, 7, 1–13. https://doi.org/10.3389/fnbot.2013.00019