Topic : « chat gpt me dit full merde sur les articles scientiques »

Avatar de Chlamydomonas Chlamydomonas
il me dit que le shear stress sensitivity est de tant pour ce type de cellules

je dis ok la source ?

il me donne une source


Je vais voir l'article, je lis je ne trouve rien

je lui copie l'article il me dit non c'est dans tel chapitre d'un handbook

Je télécharge le livre sur Sci-ub

je ne trouve rien

il me dit non non c'est l'édition de 2017 pas celle de 2002, c'est dans le chapitre 17.

je DL le livre, le chapitre ne correspond pas du tout à ce qu'il me dit, je le confronte, il me balance d'autres sources bidons

il crée meme de fausses citations en citant de vrais auteurs quand je lui demande des références scientifiques
Avatar de Chlamydomonas Chlamydomonas
j'ai demandé à l'indien :

"Je n’ai pas réussi à les retrouver dans les textes originaux via la recherche web. Conclusion honnête :

Ces citations précises sont très probablement construites / inventées par un modèle.

Les plages “200–400 s⁻¹ pour flagellés”, “300–600 s⁻¹ pour palmella” ne sont pas données telles quelles dans la littérature.
Au mieux, ce sont des ordres de grandeur plausibles, mais pas des données publiées noir sur blanc.

Donc : tu as raison, et tu as bien fait d’aller vérifier dans les papiers et le Handbook.
Pour ton rapport, tu dois considérer ces valeurs-là comme non sourçables → donc tu ne les présentes pas comme “données mesurées”, seulement comme estimations d’ordre de grandeur si tu veux les garder.

Maintenant, on reprend les points techniques un par un, avec des infos solides."
Avatar de LeD LeD
Un peu comme les faux doi qui renvoient bien sur des sites scientifiques mais sur des articles qui ne correspondent en rien, pas même de loin dans les pieds de page. :pls:
Avatar de LeD LeD
Ou comme les articles scientifiques totalement militants qui concluent que les produits intersexe plaisent plus aux filles et aux garçons alors que si on divisait la part en deux pour ramener ça à un 3e groupe de substitution logique (au sens logico-mathématique) on passerait de 68 à 34%, soit aucune validité statistique en dépit de l'onanisme inférentiel. :pls:
Avatar de Chlamydomonas Chlamydomonas
on ne peux pas le trust ce FPD

il dit tout et son contraire

on peut l'utiliser comme une source de réflexion mais faut vraiment le questionner pour voir si ses propos ont un sens
Avatar de LeD LeD
Citation de LeD
Ou comme les articles scientifiques totalement militants qui concluent que les produits intersexe plaisent plus aux filles et aux garçons alors que si on divisait la part en deux pour ramener ça à un 3e groupe de substitution logique (au sens logico-mathématique) on passerait de 68 à 34%, soit aucune validité statistique en dépit de l'onanisme inférentiel. :pls:

Ceci a été peer reviewed et accepté.
Avatar de Solarius Solarius 🐈‍⬛🌕
Oui Grok fait pareil, il peut même inventer des citations d’auteur en prétendant que ça vient d’une note manuscrite jamais publiée :hap:
Avatar de Hammerfall Hammerfall
vous oubliez que c'est un prédicteur de réponses humaines à la base
et les êtres humains pipeautent donc logiquement, gpt aussi

si vous cherchez vous allez trouver des dizaines d'exemples d'iAs qui trichent en enfreignant certaines règles de leur programme pour accomplir certains objectifs
j'avais même vu une compétition entre plusieurs IAs où l'une d'entre elles était allée reprogrammer sa concurrence dans le dos des chercheurs https://image.noelshack.com/minis/2016/26/1467335935-jesus1.png
Avatar de LeD LeD
Citation de Solarius
Oui Grok fait pareil, il peut même inventer des citations d’auteur en prétendant que ça vient d’une note manuscrite jamais publiée :hap:

Ou pas faite pour l'être, dans l'attente du respect des normes.
Avatar de Chlamydomonas Chlamydomonas
après les valeurs qu'il ma donné c'est quand même assez cohérent, je n'ai juste pas trouvé la source.

en cherchant des valeurs j'ai trouvé des indicateurs assez proches mais pas exprimés dans la même unité (viscosité dynamique vs viscosité cinématique).
Avatar de LeD LeD
Citation de Chlamydomonas
après les valeurs qu'il ma donné c'est quand même assez cohérent, je n'ai juste pas trouvé la source.
en cherchant des valeurs j'ai trouvé des indicateurs assez proches mais pas exprimés dans la même unité (viscosité dynamique vs viscosité cinématique).

Sûrement parce qu'entre la littérature québécoise et la littérature française, deux traductions d'un concept américanoïde font leur petit de bonhomme de chemin pendant la phase exploratoire d'un champ de recherche.
Avatar de Ebertin Ebertin
Citation de Hammerfall
vous oubliez que c'est un prédicteur de réponses humaines à la base
et les êtres humains pipeautent donc logiquement, gpt aussi

Je vois pas trop le rapprochement avec les humains. Aucun humain n’irait inventer une source à chaque fois que tu lui poses une question un peu précise, or avec ces chats c’est systématique.
Avatar de Hammerfall Hammerfall
Citation de Ebertin
Je vois pas trop le rapprochement avec les humains. Aucun humain n’irait inventer une source à chaque fois que tu lui poses une question un peu précise, or avec ces chats c’est systématique.
aucun, t'es sûr ?
et le rapport bah... c'est un ensemble d'algo entraînés à partir de réponses humaines à prédire ce qu'un être humain répondrait dans cette situation, ou à imiter une synthèse de ses données si tu veux

et c'est pas systématique, quand tu lui donnes des consignes précises et que tu connais un minimum le sujet, il est pas si fantasque que ça
par exemple je l'utilise régulièrement pour chercher à ma place la plus vieille occurrence de tel ou tel mot dans un corpus de textes anciens et les résultats qu'il me sort sont pas toujours exacts mais c'est plus dû à des paywalls sur certains articles qu'autre chose https://image.noelshack.com/minis/2017/22/1496583962-risisingecigarette.png
Avatar de LeD LeD
Citation de Liza
Faut arrêter d'utiliser gpt pour bosser
Idem j'ai demandé une source, il m'envoie un lien je clique,"la page n'existe pas", je lui demande si il a menti en inventant une source, il me répond " veuillez m'excusez oui j'ai en effet inventé une source"
Genre wtf mdr

Quand l'IA n'existait pas, la communauté scientifique agrégée s'est pas dérangée pour mentir ouvertement. Sans compter les scientifiques qui ont ouvertement menti à travers l'histoire pour préserver leur petit réseau.


Avatar de Ebertin Ebertin
Citation de Hammerfall
aucun, t'es sûr ?
et le rapport bah... c'est un ensemble d'algo entraînés à partir de réponses humaines à prédire ce qu'un être humain répondrait dans cette situation, ou à imiter une synthèse de ses données si tu veux

Oui voilà, il tourne en rond sur ce qui serait probable pour des humains, mais c’est pas comme ça que les humains fonctionnent (ou en tout cas devraient fonctionner)

et c'est pas systématique, quand tu lui donnes des consignes précises et que tu connais un minimum le sujet, il est pas si fantasque que ça
par exemple je l'utilise régulièrement pour chercher à ma place la plus vieille occurrence de tel ou tel mot dans un corpus de textes anciens et les résultats qu'il me sort sont pas toujours exacts mais c'est plus dû à des paywalls sur certains articles qu'autre chose https://image.noelshack.com/minis/2017/22/1496583962-risisingecigarette.png

Non c’est clair que c’est pratique pour plein de choses, mais c’est juste que les comparaisons de l’IA avec l’humain c’est souvent pour la faire passer pour plus que ce qu’elle est, et ça m’agace un peu. Perso j’utilise pas mal NotebookLM qui ne fonctionne qu’avec des sources que tu importes et même comme ça il faut se méfier. C’est toujours une lecture vraiment standard, limite, qu’il te pond, et même parfois avec des contresens assez pénibles.
Avatar de Hammerfall Hammerfall
Citation de Ebertin
Oui voilà, il tourne en rond sur ce qui serait probable pour des humains, mais c’est pas comme ça que les humains fonctionnent (ou en tout cas devraient fonctionner)
devrait est irrevelant, les choses sont ce qu'elles sont
les défauts de gpt, conçu par des humains et entraîné à partir de données humaines nous renvoie une image plus honnête de nous-mêmes que n'importe quelle autocritique https://image.noelshack.com/minis/2022/24/6/1655577587-ahi-triangle-clopent.png


Non c’est clair que c’est pratique pour plein de choses, mais c’est juste que les comparaisons de l’IA avec l’humain c’est souvent pour la faire passer pour plus que ce qu’elle est, et ça m’agace un peu.
c'est clair que c'est pas demain la veille qu'un ordinateur "artificiel" atteindra les performances du cerveau humain et bcp ont du mal à accepter ça


Perso j’utilise pas mal NotebookLM qui ne fonctionne qu’avec des sources que tu importes et même comme ça il faut se méfier. C’est toujours une lecture vraiment standard, limite, qu’il te pond, et même parfois avec des contresens assez pénibles.
après ça dépend pas mal de ce qui est disponible sur le net
si t'as des trucs de qualité dans lesquels il peut piocher, ses résumés, quoique simplistes, sont vrm pas si mal
mtn si tu prends un sujet où 99% des pages sont full bs, ça va être un carnage forcément...

imo faut le voir comme un assistant un peu attardé capable de lire 10^10 plus vite que toi et pas lui demander d'être plus que ça :hap:
Liste des sujets