Ulrike Hahn

Ulrike Hahn

just read that "Stochastic parrot" is the American Dialect Society's AI related word of the year for 2023

my thoughts on that term from last year:

https://write.as/ulrikehahn/stochastic- ... r-for-llms

comments welcome….
Re: Ulrike Hahn

UlrikeHahn. “Stochastic parrot” is a misleading metaphor for LLMs. April 1, 2023. https://write.as/ulrikehahn/stochastic- ... r-for-llms writes:

> Metaphors are hugely important both to how we think about things and how we structure debate, as a long research tradition within cognitive science attests [1]. Metaphors, as tools, can make us think better about an issue, but they can also lead us astray, depending on what relevant characteristics metaphors make clear and what they obscure. The notion that large language models (LLMs) are, in effect, “stochastic parrots” currently plays a central role in debate on LLMs. What follows are my thoughts on ways in which the metaphor is (now) creating confusion and hindering progress.

> ... what is the stochastic parrot metaphor? According to Bender and colleagues (2001),
> > Text generated by an LM is not grounded in communicative intent, any model of the world, or any model of the reader’s state of mind. It can’t have been, because the training data never included sharing thoughts with a listener, nor does the machine have the ability to do that.
> In short, LLMs lack, either partly or wholly, “situationally embedded meaning”. In line with this, I take the phrase “stochastic parrot” to make salient three main things. Like the ‘speech’ of a parrot, the output of LLMs 1) involves repetition without understanding 2) albeit with some probabilistic, generative component, and, in that, it is very much 3) unlike what humans do or produce.

> ... the metaphor seems both useful and undoubtedly effective.
> Beyond that, however, I now see it giving rise to the following problems in the wider debate:
> 1. confusion between what’s ‘in the head’ and ‘in the world’
> 2. a false sense of confidence regarding how LLMs and human cognition ‘work’
> 3. an illusion of explanatory depth
> 4. a misdirection of evaluative effort
> 5. a misdirection of discussion about risks and harms

Ad 1:

> ... when Polly the pet parrot says “Polly has a biscuit” that (in some sense) ‘means’ something, and it can be true or false, regardless of whether Polly *herself* has any idea whatsoever what those sounds she produces ‘mean’, let alone a concept of ‘language’, ‘meaning’, or ‘truth’.
> This follows simply from the fact that this aspect of meaning doesn’t rest on any single head, artificial or otherwise, but rather on the practice of a community. And whether “Polly has a biscuit” is true depends not on Polly’s grasp of human language, but on whether she actually has a biscuit.

> My pocket calculator doesn’t ‘have a grasp of meaning’. It doesn’t ‘understand’ that 2+2 = 4. But that doesn’t stop it being useful. That utility ultimately rests on there being a semantic mapping somewhere; the calculator would be of no use if 2 and 4 didn’t ‘mean’ something, at least to me. But that doesn’t require that mapping to be internal to the calculator or in any way accessible to it. It simply isn’t something the calculator itself has to ‘know’.

Ad 2:

> The framework of cognitive science, which tries to understand human thought as ‘computation’ or information processing, itself exists as a discipline precisely because we *do not* understand (fully) how human language or thought actually work.

> ... we very much don’t know how LLMs ‘work’ either.

> Neither ‘just repetition’ nor ‘next token prediction’ suffice to explain the production of a made up reference to a fictitious author, with a fictitious title, complete with fake DOI, as this reference was never *in the input* nor (for the same reason) actually ever “the most likely next token” in any straightforward way.

Ad 3:

> ... not a single computational system we built in the past has, arguably, had “access to situationally embedded meaning” in the sense Bender et al. described above. This includes any simple script or computer programme I have ever written and run (functional or not), through the basic computational devices such as a pocket calculator, through a wide range of now essential systems such as electronic databases, on to computational systems that, by whatever design approach, manage to far exceed aspects of human performance...

> ... it seems hard to sustain the notion... explains anything specifically about LLMs themselves either.

Ad 4:

> ... falsely in my view, suggests that we know something about the possible behaviour of such systems, without having to look in any detail at their actual behaviour and performance.

> To understand what LLMs can do, what they can do well, and where they fail, we have to look at and evaluate the behaviour of actual systems. Those capabilities are an empirical question. They vary across LLMs to date, and those varying capabilities in turn determine what useful functions such systems could perform. None of that work can be short circuited by an in principle consideration...

Ad 5:

> If one takes the lack of ‘situationally embedded meaning’ to fundamentally restrict what a computational system can do, then it might also make sense to take that fact to limit what harms such a system could do now or in future.
> It should, by now, be clear that ‘lack of situationally embedded meaning’ patently does not (in my view) sufficiently restrict function for that argument to go through.

> ... there is an inductive argument to be made that there is additional cause for concern, beyond present risks and harms, based on the, empirically observed, rapid improvement of performance as a function of increase in scale in language models to date...


> Whether one cares more about current, or more about potential future problems, both or neither, is a value judgment. The extent to which absence of situationally embedded meaning restricts future performance, and hence risk, by contrast, is a causal, empirical claim.
>It is an empirical issue what LLMs can do, and it is an empirical issue how they (or human beings) actually work, and what role situationally embedded meaning might play in that. The ‘stochastic parrots’ metaphor conveys something about an otherwise complex and opaque bit of technology, and to that extent, it has been helpful.
> But my impression is that it is now a red herring that misleads and distracts. It blocks and derails conversation unintentionally by pointing our thoughts in the wrong direction if we care about how these systems work and what they can do. Even worse, I think it now also functions to block conversation intentionally with increasingly exasperated restatements (ie., “they are just stochastic parrots” —why don’t you get that?).
> I think our discourse around LLMs would improve if we shifted our focus. So I would suggest that we put the metaphor to rest, at least for a bit.


[1] Lakoff, G., & Johnson, M. (2008). Metaphors we live by. University of Chicago press.

[2] Labov, W. (1973). The boundaries of words and their meanings. New ways of analyzing variation in English.

[3] Putnam, H. (1975). The meaning of” meaning”. Philosophical Papers, Mind, Language, and Reality, 2, 215-271.

[4] Katz, Daniel Martin and Bommarito, Michael James and Gao, Shang and Arredondo, Pablo, GPT-4 Passes the Bar Exam (March 15, 2023). Available at SSRN: https://ssrn.com/abstract=4389233

[5] Bowman, S. (2023) Eight things to know about language models. https://cims.nyu.edu/~sbowman/eightthings.pdf
Re: Ulrike Hahn

@UlrikeHahn@fediscience.org's blogpost clearly spells out the things I too consider problematic about (the debate about) #LLM #AI . Mine favorite one:

"... we *do not* understand (fully) how human language or thought actually work... we very much don't know how LLMs 'work' either."

But there is much more there. Here are my excerpts:

Also: I want the European Union people and institutions to address the issue. Tag for that: #CyberEU . Relates to #GeoEU and #MyEU .
Re: Ulrike Hahn

Versailleské prohlášení, 10. a 11. března 2022. Evropská rada.

Digitální oblast
Budeme investovat do digitálních technologií, včetně umělé inteligence... posílíme normativní rámec EU tak, že urychleně přijmeme projednávané legislativní akty (zejména pokud jde o... akt o umělé inteligenci)...
Re: Ulrike Hahn

I want the European Union people and institutions to address the issue. Tag for that: #CyberEU .

The European Council said a little to it in the the Versailles declaration, 10 and 11 March 2022. Here is the excerpt:
Re: Ulrike Hahn

Hledám svého unijního odborníka nebo mluvčí nebo autoritu pro oblast, kterou si zatím značím mastodonním klíčem #CyberEU:


Túty pod tímto klíčem už nějak vymezují moji představu té oblasti.

A zatím o tom píšu ve vláknu Ulrike Hahn. Jak to vzniklo, je snad patrné z vlákna.

Teď mě k oblasti vrátila rozprava:








https://mastodon.social/@ErikJonker @ErikJonker@mastodon.social a https://mastodon.nl/@Jigsaw_You @Jigsaw_You@mastodon.nl si povídají o #CyberEU často a jejich povídání mě těší.

Asi jsem snížil cíl z hledání "co s tím" na jenom mít nějaký přehled. Pokud možno celkový. Pokud možno předkládaný stručně.

Hodně se toho odehrává vně Unie. Tak, že na to Unie má nanejvýš nepřímý vliv. Spíš malý nebo dokonce žádný.

A myslím, že to, co se děje, je obrovská obluda, kterou nikdo neřídí. Neuchopitelná mnohost. Velcí hráči. Nevím. Jsem zmaten.

A když už třeba není dostupný celkový pohled, bylo by krásné kdyby se ten odborník / mluvčí / autorita věnoval dílčím otázkám se snahou nějak se vztáhnout k celkovému pohledu.

Jsem dost přesvědčen, že #CyberEU je něco důležitého. Obrovského. A když už nechápeme, co se děje, a ani to neumíme popsat, aspoň mějme otevřené nejlepší oči a ze strážního balónu ať nám hlásí, co vidí.

Kdo to je? Které instituce to jsou? Pomožte mi. Jsem ztracen.
Re: Ulrike Hahn

If you want to follow what's going with digital rights and EU policy, I recommend subscribing to the EDRi newsletter.

https://edri.org/take-action/stay-up-to ... wsletters/
Re: Ulrike Hahn

No tak zase.

> Aplikace pro občanské průkazy: Kritická zranitelnost umožňuje převzít identitu třetí strany
> Zavedení funkce online identifikace v chytrých telefonech vytvořilo obrovskou mezeru v procesu identifikace. Tu ve skutečnosti nelze uzavřít.

Řadím k #CyberEU .

Další malá částečka obrovské obludy.

Srovnal bych to s válkou Ruska proti Ukrajině a s klimatickou katastrofou.

Válka Ruska proti Ukrajině mi připadá jako nejnaléhvější velký problém Unie a můj a kdekoho. Je to veliké a souvisí to vůbec s použitím síly / války / moci oproti vládě práva / pravidel / institucí v nadunijním dění na té naší planetě a v jejím okolí. Také je to obrovsk obluda. Ale nějak mám své "zdroje" / komu věřím. Nějak tomu rozumím. Moje rozumění pro Unii a pro mě a pro spoluobyvatele nebo spoluobčany Unie a pro Ukrajince a pro NATO a pro další je: Ukrajina musí vyhrát. My ostatní, když už neproléváme krev, ji musíme rychle poskytnout všechno, co k tomu potřebuje, a pak / souběžně my, Unioňané, musíme zajistit, aby Unia byla samostatnou vojenskou / mocenskou / geopolitickou silou. #GeoEU . A jako chápu, že někdo má jiné názory. Ale struktuře rozopravy nějak rozumím. Vidím celkový obraz?

Klimatická katastrofa. To je závažnější problém než nějaká válka. Asi tak závažný, že závažnější není, i když asi jsou i stejně(?) závažné.

I tady struktuře rozpravy nějak rozumím. Vlastně tady, stejně jako u #CyberEU nemám své unijní odborníky, mluvčí, autority. A vlastně bych je taky rád měl, ale přesto tomu nějak rozumím. Věřím "vědeckému" pohledu, že už jsme se vřítili do katastrofy a pořád ještě je plno věcí, co bychom mohli a měli udělat. Zároveď vidím padesátiletou neschopnost "politického systému" něco udělat. Nevím, co s tím, ale rozumím. Vidím celkový obraz?

Oproti tomu, když se dívám na obrovskou obludu, kterou označuju klíčem #CyberEU , vidím takový zmatek, že když to přirovnám k tornádu, vnímám to jako úžasné zjednodušení.

Umělá inteligence, špehování, bezpečnost, drony, baroni... Obrovská obluda tornáduje, a nejen, že to nikdo "neřídí", zdá se mi, že tomu nikdo ani nerozumí. Nikdo tomu nerozumí ani zdaleka tak, jako rozumíme válce Ruska proti Ukrajině nebo ekologické katastrofě. Zdaleka nechápeme, co se děje. Mimo jiné asi také proto, že ta obrovská obluda super tornáduje i naši dovednost / schopnost / postupy rozumět / chápat / popisovat / domluvit se...

Nějak mám tušení, že nějaké celkové porozumění téhle obludě, se nutně dotýká hlubinných záležitostí, které u války Rusky proti Ukrajině a ekologické katastrofy zůstávají fungovat. Nebo alespoň nevystupují tak naléhavě.

Jaký svět chceme, jací chceme být, jakou chceme mít společnost... A tak podobně.

Je velice snadné se utopit v přívalu zpráv, informací, softvérů, hádvérů, sítí a já nevím čeho. Je snadné "být odborníkem" na částečku obrovské obludy. Zatím nikde nevidím ani náznak tak souhrnného pohledu, jaký je k mání pro válku Ruska proti Ukrajině (a spol) a pro ekologickou katastrofu (a spol).

