Die Fachhochschule Nordwestschweiz FHNW hat im Auftrag von Kassensturz Espresso zehn verbreitete KI-Chatbots in einem umfassenden Praxistest geprüft. Dabei mussten die Chatbots über 300 Fragen aus den Bereichen Alltag, Wissen, Recht und Gesundheit beantworten. Ein Fachgremium bewertete die Qualität der Antworten nach Verständlichkeit, Struktur und Inhalt.

Wesentliche Ergebnisse:
ChatGPT erzielte nur mittelmässige Resultate.Der populäre KI-Chatbot liefert solide, aber nicht herausragende Antworten, auch bei Schweizer Kontextfragen zeigt er Schwächen.
Problem «Halluzinationen»:Viele KI-Tools erfinden Antworten oder liefern unpassende Lösungen – etwa wenn ein Begriff wie «Stange» im Schweizer Alltag falsch interpretiert wird.
Bester im Test war das Modell Claude von Anthropic, das insgesamt die brauchbarsten Antworten lieferte.
Weitere starke Chatbots im Vergleich waren Microsoft Copilot und Google Gemini.
Schweizer Modell Lumo schnitt schlecht ab, trotz guter Datenschutz-Ansätze.
Fazit für Nutzende und Unternehmen: KI-Sprachmodelle sind inzwischen weit verbreitet und bieten nützliche Unterstützung. Sie sind aber nicht fehlerfrei und sollten besonders bei sensiblen Themen (z. B. Gesundheit, Recht) mit Vorsicht eingesetzt werden. Der Artikel zum nachlesen findet ihr hier.
Herzlich,
Dein S2Analytics-Team
Ihr Begleiter auf Ihrer persönlichen KI-Reise
