Im Zusammenhang Satz Darstellungen in tiefen neuronalen Netzen mit denen, kodiert durch das Gehirn
Forscher des Indian Institute of Science (IISc) und der Carnegie Mellon University (CMU) haben kürzlich eine Studie durchgeführt, die Erkundung der Beziehung zwischen dem Satz Darstellungen erworben durch Tiefe neuronale Netze und diejenigen, kodiert durch das Gehirn. Ihre Papier -, pre-veröffentlicht am arXiv und vorgestellt auf der diesjährigen Association for Computational Linguistics (ACL) Konferenz vorgestellt Korrelationen zwischen Aktivierungen in der Tiefe neuronale Modelle und MEG Gehirn Daten, die helfen könnten unser derzeitiges Verständnis von, wie das Gehirn und deep-learning-algorithmen verarbeiten Sprache.
„Die Forschung ist das Produkt einer Zusammenarbeit zwischen Professor Tom Mitchell‘ s brain research group an der CMU und Professor Partha Talukdar MALL lab am IISc,“ Sharmistha Jat, einer der Forscher der Durchführung der Studie, sagte TechXplore. „Die Forschung in diesen Gruppen konzentriert sich auf die Frage, wie das Gehirn Sprache versteht. Eines der wichtigsten Ziele der aktuellen Studie war es zu verstehen, algorithmen, Verfahren Sprache im Gehirn und vergleichen Sie neural network-language-Modellen.“
Jat und Ihre Kollegen dargelegt, um zu untersuchen, ob es eine Korrespondenz zwischen den hidden-Layer der deep-learning-Modelle und Gehirn-Regionen, insbesondere bei der Verarbeitung von Sprache. Außerdem waren Sie neugierig, um herauszufinden, ob deep-learning-Modelle können verwendet werden zur Synthese von Gehirn-Daten, die dann verwendet werden können in andere Aufgaben.
„Wir untersuchten einfachen Satz Darstellungen gelernt, durch verschiedene neuronale Netzwerk-Modelle reichen vom einfachen Satz zu verstehen, neuronale Netze, um state-of-the-art-Sprache-Modelle und Gehirn“ Jat gesagt. „Die main-Prozedur zu untersuchen, die Beziehung war vorhersehbar Gehirn Darstellungen aus der Modell-Darstellungen, das Grundprinzip sein, wenn die beiden Darstellungen durchgeführt, die ähnliche Informationen, dann sollten Sie vorhersehbar sein, von einander.“
In Ihrer Untersuchung, Jat und Ihre Kollegen als mehrere neuronale Netzwerk-Architekturen für die word-Darstellung, darunter zwei kürzlich vorgeschlagenen Modelle namens ELMo und BERT. Sie verglichen, wie diese Netzwerke-Prozess-insbesondere Sätze mit Daten von menschlichen Testpersonen, die magnetenzephalographie (MEG), eine funktionelle Neuro-Bildgebungs-Datenbank-Technik für die Kartierung der Aktivität des Gehirns, wie Sie Lesen die gleichen Sätze. Um damit zu beginnen, beschlossen Sie verwenden Sätze mit einfacher syntax und grundlegende Semantik, wie „der Knochen wurde gegessen durch den Hund.“
Interessanterweise fanden die Forscher, dass Aktivierungen beobachtet, in der BERT-Modell korreliert die meisten mit MEG Gehirn Daten. Ihre Ergebnisse deuten auch darauf hin, dass deep neural network-Darstellung kann verwendet werden, um synthetische Gehirn Daten, die im Zusammenhang mit neuen Sätzen, der ausbau bestehender Gehirn Daten.
„Die Sprache, die von Modellen vorhergesagte Aktivität des Gehirns mit guter Genauigkeit, das ist sehr ermutigend“, Jat erklärt. „Eine aktuelle Transformator-basierte Darstellungen (BERT) am besten entsprechen Gehirn Codierungen, die dazu ermutigt, die weitere Forschung in diese Richtung. Wir hatten auch mehrere Beobachtungen, welche Informationen (Substantiv, verb, Adjektiv, determinator) besser kodiert, welche Art von Netzwerk-Darstellungen. Unsere Hoffnung ist es, entdecken Sie die „secret sauce“ zu vollkommenen die Sprache der Modellierung-algorithmen.“
Entsprechend zu Jat und Ihre Kollegen, könnte dies die erste Studie, zu zeigen, dass die MEG-Aufnahmen, wie die Menschen Lesen ein Satz kann verwendet werden, um zu bestimmen, früheren Worte, die in diesem Satz. Darüber hinaus könnte der erste gewesen zu deep neural network-Darstellungen erfolgreich synthetische Gehirn Daten.
Die neuere Forschung von Jat und Ihre Kollegen bietet neue, wertvolle Einblicke in die Funktionsweise von Sätzen dargestellt werden, in einige state-of-the-art-neuronale Netze und wie sind Sie codiert durch das menschliche Gehirn. Ihre Beobachtungen könnten schon bald informieren, die Entwicklung neuer language processing-algorithmen, aber auch inspirieren, weitere Studien in der Erforschung der Zusammenhänge zwischen Gehirn und deep-learning-Modelle, Prozess-Informationen.