"Humanity's Last Exam" bringt KI an ihre Grenzen

"Humanity's Last Exam" bringt KI an ihre Grenzen

Moderne KI-Modelle verblüffen regelmäßig mit ihrer Leistungsfähigkeit: Sie lösen komplexe mathematische Aufgaben, analysieren wissenschaftliche Texte und schreiben sogar Gedichte – sachlich präzise und sprachlich elegant, was vor wenigen Jahren noch unmöglich schien. Doch ein neuer Test, "Humanity's Last Exam", zeigt die Grenzen dieser Technologie auf. Selbst Spitzenmodelle wie GPT-4 und Google Gemini scheitern in vielen Bereichen kläglich. Ihre Erfolgsquote liegt unter zehn Prozent.

Werbung

LANCOM Systems zum neunten Mal in Folge VPN-Champion

LANCOM Systems zum neunten Mal in Folge VPN-Champion

Der deutsche Netzwerk- und Security-Hersteller LANCOM Systems hat im „Professional User Rating: Security Solutions 2025“ (PUR-S) des Analystenhauses techconsult zum neunten Mal in Folge seine Spitzenposition im Bereich Virtual Private Network (VPN) bestätigt. [...]

Tägliche Meldungen zu Startups

Fähigkeiten für die Zukunft: Hybride Ausbildung unserer Talente von morgen

Was braucht es für ein Bildungssystem, dass die Arbeitskräfte von morgen mit den notwendigen Werkzeugen und Fähigkeiten ausstattet, die für eine erfolgreiche Zukunft inmitten ständiger technologischer Innovation erforderlich sind?weiterlesen auf t3n.de

Experten über Deepseeks Erfolgsgeheimnis: Warum nicht nur die Technik entscheidend war

Der Erfolg von Deepseek soll nicht nur der Technik des neuen KI-Modells geschuldet sein. Experten für die chinesische Tech-Landschaft gehen davon aus, dass das KI-Startup auch in der Arbeitswelt und bei der Finanzierung alles richtig gemacht hat. weiterlesen auf t3n.de

Trump-Zölle: Bitcoin fällt unter 95.000 Dollar, Blutbad bei vielen Altcoins

Der Kryptomarkt erlebt einen dramatischen Einbruch, nachdem US-Präsident Donald Trump am Wochenende neue Handelszölle angekündigt hat. Die Maßnahmen, die ab Dienstag in Kraft treten, umfassen 25% Zölle auf Importe aus Kanada und Mexiko sowie 10% auf chinesische Waren. Zudem hat Trump auch bereits angekündigt, Zölle gegen die EU einzuführen,

Waffle: Startup-Veteranen wollen die guten alten WhatsApp-Zeiten zurück

Zuerst ein Chatbot-Startup namens Dvel bzw. Swelly, dann ein Kaffee-Startup, dann eine App für Menschen mit Einschränkungen, und jetzt schon wieder etwas Neues. Der oberösterreichische Unternehmer Peter Buchroithner hat sich mit Verena Haku (CDO), David Pfluegl (CPO) und Thomas Schranz (CTO) zusammengetan, um die guten alten WhatsApp-Zeiten wie

Schock für Investoren: KI-Startup-Gründer verprasst 60 Millionen Dollar

Immobilien, Schmuck, ein Tesla und eine luxuriöse Hochzeit – der Gründer des US-amerikanischen KI-Startups On Platform hat es sich auf Kosten seiner Investor:innen gut gehen lassen und sitzt jetzt in Haft.weiterlesen auf t3n.de

Handelswerbung: Warum der Abschied vom Prospekt so schwierig ist

Der Handel hat den Abschied vom klassischen Papierprospekt eingeleitet, tut sich mit dem Schritt aber noch schwer, wie die Rückkehr von Aldi zum gedruckten Handzettel zeigt. Tobias Kern, Gründer des IT-Beratungs- und Dienstleistungsunternehmen The Shoring Company und ehemaliger Digitalisierungschef von Kaufland Digital, erklärt in seinem Gastbei

Bitcoin fällt nach US-Zöllen gegen Kanada, Mexiko und China unter 100.000 Dollar

Bitcoin ist nach der Ankündigung neuer US-Tarife auf Importe aus Kanada, Mexiko und China unter die psychologisch wichtige Marke von 100.000 US-Dollar gefallen. Die direkten und indirekten Auswirkungen der Handelspolitik haben zu einer Kombination aus Risikoaversion, wirtschaftlicher Unsicherheit und Spekulationen über geldpolitische Folgen gefü

Wirkungsgrad: Neue Tandem-Solarzellen brechen Rekord

Der Beitrag Wirkungsgrad: Neue Tandem-Solarzellen brechen Rekord von Felix Baumann erschien zuerst auf BASIC thinking. Über unseren Newsletter bleibst du immer aktuell. Tandem-Solarzellen versetzen die Solar-Branche derzeit in Aufruhr. Aufgrund ihrer verschiedenen Schichten und Materialien setzen neue Maßstäbe. Ein neues Modell verspricht nun ei

OpenAI Launches o3-mini, its Cheapest But Most Dangerous AI Model to Date

In a week where a single young AI company from China has turned the entire AI world upside down, OpenAI couldn’t stay silent. While Anthropic CEO Dario Amodei found clear words about DeepSeek’s facts and development costs, the most valuable and well-known AI startup is now following suit. New Model Features The new AI model […] De

OpenAI launcht o3-mini, sein bisher günstigstes, aber auch gefährlichstes AI-Modell

In einer Woche, in der eineeinzige junge AI-Firma aus China die komplette KI-Welt auf den Kopf gestellt hat, darf OpenAI mit einer Antwort nicht fehlen. Während Anthropic-CEO Dario Amodei klare Worte zu den Fakten von DeepSeek und seinen Entwicklungskosten fand (mehr dazu hier), liefert das bisher wertvollste und bekannteste AI-Startup nach. Mit d

ETFs, Lighting, Staking & Bitcoin für Tschechien: Aktuellen Entwicklungen im Überblick

Ed Prinz ist Vorsitzender von DLT Austria, der renommiertesten gemeinnützigen Organisation in Österreich, die auf Blockchain-Technologie spezialisiert ist. In seinen Gastbeiträgen beschäftigt er sich mit den führenden Krypto-Assets und ihrer Rolle in der Finanzwelt. Die jüngsten Entwicklungen im ETF-Sektor zeigen, dass institutionelle Inves

Google: New AI model Gemini 2.0 Pro Experimental deleted after release

It seems that Google is working on the release of its next AI flagship model: Gemini 2.0 Pro Experimental. Recently, the company reported on its latest update in the Gemini changelog and deleted the entry shortly afterward. It announced an AI with better factual accuracy for solving complex tasks – especially in the areas of […] Der Bei

Exchanges #368: Das Potenzial von Zalando+About You

Welche Chancen haben Zalando und About You in einer Welt, die von Shein und TikTok Shop geprägt wird? Das fragen sich Jochen Krisch und Marcel Weiß in den jüngsten Exchanges. Wo liegen die Potenziale, wo die Herausforderungen? Und wie könnte... Weiterlesen ›

Amazon und Microsoft bieten DeepSeek R1 über ihre Clouds an

Es passiert alles fast gleichzeitig: Zuerst hat DeepSeek aus China die AI-Welt auf den Kopfgestellt und Abwehrreaktionen und Kritik in den USA ausgelöst, jetzt kommt schon die Integration: Das chinesische KI-Modell DeepSeek R1 erreicht einen bedeutenden Meilenstein mit der gleichzeitigen Integration in die Cloud-Plattformen von Amazon Web Services

EU-Milliarde für DefenseTech teilweise auch für Startups und Scale-ups

Roboter für Militäroperationen, günstige Drohnen, eine Kampf-Cloud, und Startups sollen auch mitmischen können: Die Europäische Kommission hat ihr fünftes Jahresarbeitsprogramm im Rahmen des Europäischen Verteidigungsfonds (EEF) vorgestellt. Mit einem Budget von mehr als einer Milliarde Euro sollen kooperative Forschungs- und Entwicklungspro

facebook twitter linkedin email