OpenAI hat einen neuen Benchmark-Test entwickelt, um die Genauigkeit aktueller KI-Modelle zu überprüfen. Dabei lieferten sogar die Spitzenmodelle oft falsche Antworten. OpenAI hat unter dem Titel "SimpleQA" einen Benchmark-Test entwickelt, um die Antwortgenauigkeit eigener und konkurrierender KI-Modelle zu überprüfen. Dabei geht es um Fragen, für die es nur eine korrekte Antwort gibt. In einem Paper hat das Unternehmen die Ergebnisse vorgestellt. ...Den vollständigen Artikel lesen ...
© 2024 t3n