Was ein "Minimal Turing Test" über Menschen aussagt

How to Kill Your CPU with "Safe" Voltages (Juli 2019).

Anonim

Im Jahr 1950 fragte der Computerwissenschaftler Alan Turing "Können Maschinen denken?" Und schlug einen Test vor: Konnte ein Computer überzeugend einen Menschen im schriftlichen Gespräch nachahmen? Nun haben zwei Kognitionswissenschaftler eine vereinfachte Version des Tests vorgeschlagen, nicht um künstliche Intelligenz herauszufordern, sondern um zu erforschen, was wir Menschen für besonders halten.

In ihrem "Minimal Turing Test" bekommen Menschen und Maschinen nur ein Wort, um einen menschlichen Richter davon zu überzeugen, dass sie am Leben sind. Was würden Sie sagen? Sie führten eine Online-Umfrage durch, die in der November-Ausgabe des Journal of Experimental Social Psychology beschrieben wurde, die ich auch für Science behandelte . Ungefähr tausend Teilnehmer boten vierhundert verschiedene Wörter an, wobei die häufigsten Liebe (14%), Mitgefühl (3, 5%), Mensch (3, 2%) und bitte (2, 7%) waren. Die anderen fielen in die Kategorien Affekt (zB Glück ), Glaube und Vergebung ( Jesus ), Essen ( Banane ), Roboter und Tiere ( Hund ), Leben und Tod ( Familie ) sowie Körperfunktionen und Obszönitäten ( Penis ).

Siehe unten für ein Diagramm der Wörter, die mehr als einmal verwendet werden, mit der Kreisgröße, die Popularität anzeigt. Die Farbe gibt die Kategorie an. Die Position gibt die "Einbettung" eines Wortes an, ein algorithmisches Maß seiner Bedeutung, so dass ähnliche Wörter nahe beieinander liegen.

Siebenundvierzig Prozent der Leute boten ein Wort an, das mit dem Verstand in Verbindung stand. Von diesen bezeichneten 15% einen mit Denken und Tun (wie Urteilsvermögen) und 85% nannten einen Zusammenhang mit Fühlen und Fühlen (wie Kummer ). Die Leute scheinen zu glauben, dass Computer schlau sind, aber für Worte, die subjektive Erfahrungen beschreiben, wenig brauchbar wären. (Frühere Untersuchungen über das "unheimliche Tal des Geistes" zeigen, dass Computer, wenn sie über Gefühle und Gefühle sprechen, gruselig sind.)

Wie effektiv sind diese Entscheidungen? Die Forscher nahmen das oberste Wort aus jeder Kategorie: Liebe, bitte, Barmherzigkeit, Mitgefühl, Empathie, Banane, lebendig, menschlich, Roboter und Kot. Zweitausend Online-Teilnehmer sahen jeweils eine zufällige Paarung und vermuteten, die von einem Menschen zur Verfügung gestellt wurde (obwohl beide waren). Abgesehen von der Liebe gab es keine Korrelation zwischen der Popularität eines Wortes in der ersten Aufgabe und seiner Überzeugungskraft in der zweiten, was darauf hindeutet, dass die Einreichenden nicht vorhersagen konnten, wie Wörter empfangen werden. Das winningest Wort war Poop . In der Abbildung unten geben Prozentangaben an, wie oft ein Zeilenwort ein Spaltenwort übertrifft.

Die Forscher - John McCoy, jetzt an der Universität von Pennsylvania, und Tomer Ullman am MIT - schreiben, dass wenn sie mehr Wörter in die zweite Aufgabe aufgenommen hätten, die Emotionen hervorrufen, anstatt sie nur zu beschreiben, wie zum Beispiel Obszönitäten wurde auch als menschlich beurteilt. Würde Silizium den viszeralen Ekel verdächtigen, den einige Leute bei dem feuchten Wort fühlen? (Es wird nach dem Lesen dieses Artikels.)

Einige lustige Wörter, die von einsamen Teilnehmern der ersten Aufgabe angeboten werden: Smurf, Smegma, Ginormous, Yolo, Noob, Oops, Lol, Omg, Fremie, Coexist, Hitler, Captcha, Terminator, huh ?, und f * ck off . Einige haben den Moment wirklich gefangen. Auf die Frage, ob letzteres wirklich ein Wort sei, sagte McCoy: "Als Meta-Richter dieses ganzen Prozesses haben wir beschlossen, es zuzulassen, da es wie eine angemessene Reaktion schien."

Die Forscher glauben, dass ihr Test die Intuitionen der Menschen über das, was Menschen von Maschinen trennt, hervorhebt und dass er dazu genutzt werden könnte, andere Stereotypen zu testen. Welches Wort glauben die Leute, dass eine Frau oder eine alte Person sagen würde? Die Interpretation wird jedoch dadurch erschwert, dass die Befragten darüber nachdenken müssen, wie andere Menschen denken, dass sie denken.

Ich habe den Forschern gesagt, dass ihr Test eine laute Art zu fragen ist, welche Eigenschaften Menschen angeblich von Maschinen trennen, da Antworten durch rekursive mentale Modellierung und andere Prozesse gefiltert werden. Könnten sie die Leute nicht einfach bitten, ein einzigartig menschliches Attribut oder eine bestimmte Angelegenheit zu nennen? McCroy sagte, es sei "nicht wirklich so offensichtlich", wie man solche Urteile am besten entlockt. Sie vermuten, dass "der Wettbewerbsdruck, wenn wir die Frage stellen, dazu führen wird, dass einige Menschen tiefere, nicht-offensichtliche Attribute kommunizieren, die Menschen und Maschinen trennen" - wie zum Beispiel löchrig -, da offensichtliche Attribute zur Niederlage durch einen intelligenten Roboter führen können.

In der Tat spürten einige den Wettbewerbsdruck. In der zweiten Aufgabe, sagte Ullman, sagte ein Teilnehmer: "Mann, das war wirklich schwer. Ich fühlte mich, als wäre ich in einer kurzen Asimov-Geschichte! "Die Forscher sahen auf das Wortpaar, das diese Person gesehen hatte: Roboter und Mensch .

Verweise

McCoy, JP & Ullman, TD (2018). Ein minimaler Turing-Test. Zeitschrift für experimentelle Sozialpsychologie, 79, 1-8.