Vectara stellt den Factual Consistency Score vor, der auf dem beliebten Open-Source-Modell Hughes Hallucination Evaluation Model basiert. Dies ist eine Branchenneuheit innerhalb seiner serverlosen RAGaaS-Plattform, die die Transparenz von KI-Antworten und die Kontrolle durch den Benutzer verbessert, indem sie detaillierte Genauigkeits- und Halluzinationsbewertungen liefert.
Vectara, die vertrauenswürdige Produktplattform für generative KI, kündigte die Aufnahme eines Factual Consistency Score (FCS) für alle generativen Antworten an, der auf einer weiterentwickelten Version des bahnbrechenden Hughes Hallucination Evaluation Model (HHEM) basiert der Nummer 1 bei der Erkennung von Halluzinationen auf Hugging Face mit mehr als 100.000 Downloads seit seiner Einführung im vergangenen November. Das zugehörige Hallucination Leaderboard ist jetzt der Industriestandard, wie LLMs ihre durchschnittliche faktische Konsistenz messen. Die End-to-End Retrieval Augmented Generation-as-a-Service (RAGaaS)-Plattform von Vectara setzt einen neuen Standard als branchenweit erste Funktion für GenAI-Reaktionstransparenz, indem sie End-to-End RAG-Beobachtbarkeit in Echtzeit bietet. Diese innovative Metrik bietet einen beispiellosen Einblick in die faktische Konsistenz zusammengefasster Antworten innerhalb der RAGaaS-Plattform von Vectara und ermöglicht es Benutzern, personalisierte Schwellenwerte für die Annahme von Antworten auf der Grundlage einer detaillierten Genauigkeitsbewertung festzulegen.
Da die durchschnittlichen Halluzinationsraten der auf dem Markt befindlichen LLMs zwischen 3 und 16,2 liegen, bleibt das Risiko unbekannter Ungenauigkeiten bei der Beantwortung der Fragen ein großes Problem, das eine breite Nutzung dieser leistungsstarken Technologie durch Unternehmen verhindert. Vectara entschärft diese Mehrdeutigkeit für Unternehmen, indem es einen Factual Consistency Score bereitstellt, der die Wahrscheinlichkeit bewertet, ob die generierte Antwort eine Halluzination ist oder nicht. Nur mit einer standardisierten, wissenschaftlich berechneten Methode zur Bewertung von Antworten können Unternehmen GenAI verantwortungsvoll in geschäftskritische Anwendungen einführen. Die Benutzer haben die Möglichkeit, Schwellenwerte für die Annahme von Antworten auf der Grundlage einer detaillierten Genauigkeitsbewertung festzulegen, so dass die Produktteams flexibel auf diese Informationen reagieren können.
Der Factual Consistency Score von Vectara ist ein bahnbrechendes Tool in der GenAI, das einen neuen Maßstab für die Erkennung von Halluzinationen in Echtzeit setzt und eine überragende Leistung, Erschwinglichkeit und Geschwindigkeit bietet und damit einen bedeutenden Sprung nach vorne in Sachen Vertrauen markiert. Dank ihrer Effizienz und Effektivität können Unternehmen GenAI in kritischen Produktanwendungen einsetzen, ohne sich Sorgen über die Haftung zu machen, die sich aus halluzinierten Reaktionen ergeben könnte.
Der Factual Consistency Score von Vectara gibt Entwicklern die Möglichkeit, eine breite Palette von Anwendungen zu verfeinern und zu verbessern, von internen Q&A-Systemen bis hin zur Qualität der Interaktionen mit Endverbrauchern. Die Stärke dieses Wertes liegt in seiner Kalibrierung, die ihn als direkte Wahrscheinlichkeit interpretierbar macht ein Wert von 0,98 bedeutet beispielsweise eine 98%ige Wahrscheinlichkeit für faktische Konsistenz. Dies steht in krassem Gegensatz zu vielen modernen ML-Klassifikatoren, die die Kalibrierung außer Acht lassen und dadurch an Klarheit und direkter Interpretierbarkeit einbüßen.
"Die Integration des Factual Consistency Score von Vectara in die Yobi-App wird die Art und Weise revolutionieren, wie wir mit KI-Transparenz und -Genauigkeit für geschäftliche Anwendungsfälle umgehen. Indem wir die von unserer Plattform gelieferten Antworten transparent und nachvollziehbar machen, können wir unserem Engagement für eine verantwortungsvolle KI, auf die sich Unternehmen verlassen können, treu bleiben", sagte Ahmed Reza, Gründer und CEO der Yobi-App. "Als Co-Innovate Partner von Vectara sind wir begeistert, dass diese fortschrittliche Technologie direkt in die Vectara-Plattform integriert wird."
Das fortschrittliche HHEM, das dem Factual Consistency Score zugrunde liegt, bietet eine größere Transparenz als die zuvor veröffentlichten Open-Source-Versionen, eine höhere Genauigkeit und eine erweiterte Sprachunterstützung. Diese Initiative ist Teil des Engagements von Vectara für Transparenz und Kontrolle, das Unternehmen die Autonomie gibt, KI-Reaktionen effektiv zu verwalten.
"So wie wir schon früh mit RAG Pionierarbeit geleistet haben, um die Relevanz und Qualität von generierten Inhalten zu verbessern, so sind wir auch jetzt wieder an der Spitze der verantwortungsvollen KI, indem wir ganz offen über unsere Bemühungen sprechen, Halluzinationen in der generativen KI abzuschwächen", sagte Amr Awadallah, Mitbegründer und CEO von Vectara. "Indem wir unseren Kunden Echtzeit-Zugriff auf faktische Konsistenzbewertungen bieten, schaffen wir nicht nur Vertrauen, sondern geben ihnen auch die Kontrolle, so dass sie fundierte Entscheidungen darüber treffen können, wie sie die von unserer RAGaaS-Plattform generierten Antworten nutzen wollen."
Über Vectara
Vectara ist eine End-to-End-Plattform für die Einbettung leistungsstarker generativer KI-Funktionen in Anwendungen mit außergewöhnlichen Ergebnissen. Als End-to-End Retrieval Augmented Generation (RAG)-Plattform liefert Vectara den kürzesten Weg zu einer korrekten Antwort/Aktion über einen sicheren und vertrauenswürdigen Einstiegspunkt. Vectara trainiert nie mit Ihren Daten und ermöglicht es Unternehmen, generative KI-Funktionen ohne das Risiko von Daten- oder Datenschutzverletzungen einzubinden. Um mehr zu erfahren, besuchen Sie bitte vectara.com.
Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.
Originalversion auf businesswire.com ansehen: https://www.businesswire.com/news/home/20240326362896/de/
Contacts:
Carly Bourne
carly@bulleitgroup.com
423-443-0449