Nota AI hat zwei Beiträge zur MoE-Quantisierung für den ICML 2026 Workshop eingereicht und beweist damit seine weltweite Wettbewerbsfähigkeit bei der Optimierung groß angelegter KI-Projekte

11.06.2026
  • Zwei Beiträge zu MoE-spezifischen Quantisierungsalgorithmen wurden für einen Workshop angenommen, der im Rahmen der ICML 2026 abgehalten wird
  • Die Auszeichnung folgt auf den Gesamtsieg von Nota AI beim NVIDIA Nemotron Hackathon
  • Stärkung der zentralen Optimierungstechnologien, um große KI-Modelle zu verkleinern und ihre Ausführung effizienter zu gestalten

SEOUL, Südkorea, 11. Juni 2026 /PRNewswire/ -- Nota AI, ein auf die Komprimierung und Optimierung von KI-Modellen spezialisiertes Unternehmen, gab bekannt, dass zwei seiner Beiträge zu MoE-spezifischen Quantisierungsalgorithmen für den Workshop „Resource-Adaptive Foundation Model Inference (AdaptFM)" im Rahmen der ICML 2026, einer der weltweit führenden Konferenzen für maschinelles Lernen, angenommen wurden.

Die ICML gilt allgemein als eine der weltweit führenden Konferenzen im Bereich des maschinellen Lernens und der künstlichen Intelligenz und vereint die neuesten Forschungsergebnisse von globalen Technologieunternehmen, führenden Universitäten und bedeutenden Forschungseinrichtungen. Der AdaptFM-Workshop konzentriert sich auf Technologien, die es ermöglichen, groß angelegte KI-Modelle unter begrenzten Rechenressourcen effizient auszuführen. Forscher von globalen Unternehmen und Forschungseinrichtungen, darunter Amazon und Meta, sind im Organisationskomitee vertreten, während Forscher von führenden KI-Unternehmen wie NVIDIA, Qualcomm AI Research, OpenAI, Apple und Microsoft ebenfalls als Mitglieder des Programmkomitees teilnehmen.

Diese Leistung ist von großer Bedeutung, da sie das gesammelte technische Know-how von Nota AI bei der Optimierung von Mixture-of-Experts (MoE)-Modellen würdigt – einer Architektur, die zunehmend als Kernstruktur für große Sprachmodelle (LLMs) angesehen wird. MoE-Modelle verbessern sowohl die Leistung als auch die Effizienz, indem sie je nach Bedarf nur eine Teilmenge von Expertenmodellen aktivieren. Ihre komplexe Struktur erfordert jedoch einen anderen Ansatz bei der Quantisierung – dem Prozess, Modelle kleiner und effizienter zu machen – als bei herkömmlichen Modellarchitekturen.

Nota AI gewann zuvor sowohl seinen eigenen Track als auch den Gesamtwettbewerb beim NVIDIA Nemotron Hackathon mit einer datengesteuerten MoE-Quantisierungsmethode. Mit der Annahme dieser beiden Beiträge wird Nota AI erneut Forschungsergebnisse, die speziell für MoE-Architekturen entwickelt wurden, auf einer globalen Forschungsbühne präsentieren.

Der erste angenommene Beitrag, „DREAM-MoE", schlägt eine Methode vor, um Veränderungen im Entscheidungsfluss eines Modells zu reduzieren, die auftreten können, wenn groß angelegte KI-Modelle über mehrere Segmente hinweg quantisiert werden. Die Methode konzentriert sich auf die Tatsache, dass selbst ein kleiner Fehler in einem früheren Segment die Expertenauswahl in späteren Segmenten beeinflussen kann. DREAM-MoE hilft dem quantisierten Modell dabei, Experten so auszuwählen, dass das Ergebnis näher am ursprünglichen Modell bleibt.

Die zweite Arbeit, „SRA-MoE", schlägt eine Methode vor, die wichtige Eingaben identifiziert und priorisiert, die einen größeren Einfluss auf die endgültige Ausgabe des Modells haben. Anstatt alle Eingaben gleich zu behandeln, ist SRA-MoE darauf ausgelegt, zu verhindern, dass die Expertenauswahl für diese Schlüssel-Eingaben erheblich gestört wird, was dazu beiträgt, die Modellqualität unter begrenzten Ressourcen effektiver aufrechtzuerhalten.

Beide Studien zeigten eine höhere Leistung im Vergleich zu den neuesten MoE-spezifischen Quantisierungsmethoden. Dies zeigt, dass groß angelegte KI-Modelle mit weniger Speicher und weniger Rechenressourcen ausgeführt werden können, während Qualitätsverluste reduziert werden. Weil die Kosten, der Stromverbrauch und die Hardware-Belastung beim Betrieb großer KI-Modelle weiter steigen, gewinnen MoE-spezifische Quantisierungstechnologien zunehmend an Bedeutung.

Nota AI hat seine Forschungs- und Entwicklungsbemühungen proaktiv auf die Optimierung großer KI-Modelle konzentriert, die erhebliche Speicher- und Rechenressourcen erfordern. Das Unternehmen treibt die Optimierung groß angelegter Modelle, darunter Solar MoE, als Teil des vom Upstage-Konsortium geleiteten Sovereign-Foundation-Model-Projekts voran. Zudem erweitert es seine Erfahrung bei der Quantisierung von NVIDIA Nemotron 3 Nano auf neuere große Modelle wie Nemotron Ultra und erweitert damit den Anwendungsbereich seiner Optimierungstechnologien weiter.

„Die Annahme dieses Beitrags spiegelt die kontinuierlichen Fortschritte von Nota AI bei MoE-spezifischen Quantisierungstechnologien wider", sagte Myungsu Chae, CEO von Nota AI. „Nach unserem Gesamtsieg beim NVIDIA Nemotron Hackathon freuen wir uns, unsere Forschungsergebnisse auf dem ICML 2026 AdaptFM Workshop zu präsentieren. Wir werden weiterhin Optimierungstechnologien entwickeln, die einen effizienteren und praktischeren Einsatz großer KI-Modelle ermöglichen."

Darüber hinaus wird Nota AI während der ICML 2026 im COEX in Seoul die „Nota AI – Korea Efficient Days" veranstalten. Die Veranstaltung bringt globale Forscher, Ingenieure und Führungskräfte aus der Wirtschaft zusammen, die Korea besuchen, um Forschungstrends und industrielle Anwendungen von Efficient AI auszutauschen. Im Rahmen der Veranstaltung plant Nota AI, seine Forschungsergebnisse zur Optimierung groß angelegter KI-Modelle vorzustellen und Möglichkeiten für technische Zusammenarbeit und geschäftliche Kontakte zu erweitern.

Cision View original content to download multimedia:https://www.prnewswire.com/de/pressemitteilungen/nota-ai-hat-zwei-beitrage-zur-moe-quantisierung-fur-den-icml-2026-workshop-eingereicht-und-beweist-damit-seine-weltweite-wettbewerbsfahigkeit-bei-der-optimierung-groW-angelegter-ki-projekte-302798010.html

Other news

Zürich-Einsatz für Trump Jr.: Warum der Bund statt der Veranstalter zahlt

12.06.2026

Der Auftritt von Donald Trump Jr. an einem privaten Wirtschaftstreffen in Zürich beschäftigt nun die Schweizer Politik – und die Steuerzahler. Für den Sicherheitsaufwand rund um den Besuch des Sohns des US-Präsidenten kommt nicht die Veranstalterin Davos Lodge auf, sondern der Bund. Die Stadtpolizei Zürich bestätigt, sie habe auf Anweisung des Bundesamts für Polizei Fedpol gehandelt und den gesamten Polizeieinsatz dem Bund in Rechnung gestellt. Damit werden die Kosten über den Bundeshaushalt von Steuerzahlerinnen und Steuerzahlern in der ganzen Schweiz getragen.

Trump Jr. war Anfang Juni im Zunfthaus zur Saffran vor einer exklusiven Runde von rund 70 bis 75 Gästen aus Wirtschaft und Politik aufgetreten, organisiert von der Netzwerkplattform Davos Lodge. Das Treffen fand unter Ausschluss der Öffentlichkeit statt, im Anschluss war ein privates Dinner vorgesehen. Rund um den Anlass wurden in der Zürcher Innenstadt zeitweise Strassen gesperrt und Trams blockiert, ein grösseres Aufgebot von Bundes- und Stadtpolizisten stand neben dem US Secret Service im Einsatz. Zur genauen Höhe der Kosten schweigen sowohl Fedpol als auch Stadtpolizei mit Verweis auf Sicherheitsüberlegungen.

Brisant ist der Fall, weil es sich um ein rein privates Treffen ohne offiziellen Staatsbesuch oder öffentliches Amt des Gastes handelte. Grundsätzlich sieht die Verordnung über den Schutz von Personen und Gebäuden in Bundesverantwortung vor, dass Private die Kosten für Schutzmassnahmen selbst tragen müssen, wenn sie schutzbedürftige Personen einladen. Fedpol beruft sich hier jedoch auf Ausnahmeregelungen: Zum einen jene Bestimmung, wonach auch Personen ohne völkerrechtlichen Status geschützt werden können, «bei denen allerdings der Schutz notwendig ist, damit dem Ansehen der Schweiz nicht geschadet wird». Zum anderen verweist das Amt auf die Möglichkeit einer Abgeltung durch den Bund, wenn ein Anlass eine herausragende Bedeutung und weitreichende Auswirkungen auf die internationalen und wirtschaftlichen Interessen der Schweiz habe. Wie diese Kriterien im konkreten Fall erfüllt sein sollen, kommentiert Fedpol nicht; zu Lagebeurteilungen und Sicherheitsdispositiven äussere man sich «aus taktischen Gründen nicht».

Die Intransparenz sorgt in Zürich für ein politisches Nachspiel. Drei Gemeinderatsmitglieder der SP haben eine Anfrage eingereicht, die insbesondere Klarheit über die Kosten und die Entscheidungsgrundlagen des Bundes einfordern soll. Auch die Veranstalterin Davos Lodge beantwortete die Frage nach einer Beteiligung an den Sicherheitskosten nicht direkt und verwies lediglich darauf, man arbeite im Einklang mit den geltenden Schweizer Vorschriften und stimme sich mit den Behörden ab. Während Insider von sechsstelligen Beträgen für den Zugang zum Netzwerk-Event berichten, bleiben die öffentlichen Kosten des Polizeiaufgebots vorerst unter Verschluss.