Alpen Spiegel | Nota AI hat zwei Beiträge zur MoE-Quantisierung für den ICML 2026 Workshop eingereicht und beweist damit seine weltweite Wettbewerbsfähigkeit bei der Optimierung groß angelegter KI-Projekte

Nota AI hat zwei Beiträge zur MoE-Quantisierung für den ICML 2026 Workshop eingereicht und beweist damit seine weltweite Wettbewerbsfähigkeit bei der Optimierung groß angelegter KI-Projekte

11.06.2026

Zwei Beiträge zu MoE-spezifischen Quantisierungsalgorithmen wurden für einen Workshop angenommen, der im Rahmen der ICML 2026 abgehalten wird
Die Auszeichnung folgt auf den Gesamtsieg von Nota AI beim NVIDIA Nemotron Hackathon
Stärkung der zentralen Optimierungstechnologien, um große KI-Modelle zu verkleinern und ihre Ausführung effizienter zu gestalten

SEOUL, Südkorea, 11. Juni 2026 /PRNewswire/ -- Nota AI, ein auf die Komprimierung und Optimierung von KI-Modellen spezialisiertes Unternehmen, gab bekannt, dass zwei seiner Beiträge zu MoE-spezifischen Quantisierungsalgorithmen für den Workshop „Resource-Adaptive Foundation Model Inference (AdaptFM)" im Rahmen der ICML 2026, einer der weltweit führenden Konferenzen für maschinelles Lernen, angenommen wurden.

Die ICML gilt allgemein als eine der weltweit führenden Konferenzen im Bereich des maschinellen Lernens und der künstlichen Intelligenz und vereint die neuesten Forschungsergebnisse von globalen Technologieunternehmen, führenden Universitäten und bedeutenden Forschungseinrichtungen. Der AdaptFM-Workshop konzentriert sich auf Technologien, die es ermöglichen, groß angelegte KI-Modelle unter begrenzten Rechenressourcen effizient auszuführen. Forscher von globalen Unternehmen und Forschungseinrichtungen, darunter Amazon und Meta, sind im Organisationskomitee vertreten, während Forscher von führenden KI-Unternehmen wie NVIDIA, Qualcomm AI Research, OpenAI, Apple und Microsoft ebenfalls als Mitglieder des Programmkomitees teilnehmen.

Diese Leistung ist von großer Bedeutung, da sie das gesammelte technische Know-how von Nota AI bei der Optimierung von Mixture-of-Experts (MoE)-Modellen würdigt – einer Architektur, die zunehmend als Kernstruktur für große Sprachmodelle (LLMs) angesehen wird. MoE-Modelle verbessern sowohl die Leistung als auch die Effizienz, indem sie je nach Bedarf nur eine Teilmenge von Expertenmodellen aktivieren. Ihre komplexe Struktur erfordert jedoch einen anderen Ansatz bei der Quantisierung – dem Prozess, Modelle kleiner und effizienter zu machen – als bei herkömmlichen Modellarchitekturen.

Nota AI gewann zuvor sowohl seinen eigenen Track als auch den Gesamtwettbewerb beim NVIDIA Nemotron Hackathon mit einer datengesteuerten MoE-Quantisierungsmethode. Mit der Annahme dieser beiden Beiträge wird Nota AI erneut Forschungsergebnisse, die speziell für MoE-Architekturen entwickelt wurden, auf einer globalen Forschungsbühne präsentieren.

Der erste angenommene Beitrag, „DREAM-MoE", schlägt eine Methode vor, um Veränderungen im Entscheidungsfluss eines Modells zu reduzieren, die auftreten können, wenn groß angelegte KI-Modelle über mehrere Segmente hinweg quantisiert werden. Die Methode konzentriert sich auf die Tatsache, dass selbst ein kleiner Fehler in einem früheren Segment die Expertenauswahl in späteren Segmenten beeinflussen kann. DREAM-MoE hilft dem quantisierten Modell dabei, Experten so auszuwählen, dass das Ergebnis näher am ursprünglichen Modell bleibt.

Die zweite Arbeit, „SRA-MoE", schlägt eine Methode vor, die wichtige Eingaben identifiziert und priorisiert, die einen größeren Einfluss auf die endgültige Ausgabe des Modells haben. Anstatt alle Eingaben gleich zu behandeln, ist SRA-MoE darauf ausgelegt, zu verhindern, dass die Expertenauswahl für diese Schlüssel-Eingaben erheblich gestört wird, was dazu beiträgt, die Modellqualität unter begrenzten Ressourcen effektiver aufrechtzuerhalten.

Beide Studien zeigten eine höhere Leistung im Vergleich zu den neuesten MoE-spezifischen Quantisierungsmethoden. Dies zeigt, dass groß angelegte KI-Modelle mit weniger Speicher und weniger Rechenressourcen ausgeführt werden können, während Qualitätsverluste reduziert werden. Weil die Kosten, der Stromverbrauch und die Hardware-Belastung beim Betrieb großer KI-Modelle weiter steigen, gewinnen MoE-spezifische Quantisierungstechnologien zunehmend an Bedeutung.

Nota AI hat seine Forschungs- und Entwicklungsbemühungen proaktiv auf die Optimierung großer KI-Modelle konzentriert, die erhebliche Speicher- und Rechenressourcen erfordern. Das Unternehmen treibt die Optimierung groß angelegter Modelle, darunter Solar MoE, als Teil des vom Upstage-Konsortium geleiteten Sovereign-Foundation-Model-Projekts voran. Zudem erweitert es seine Erfahrung bei der Quantisierung von NVIDIA Nemotron 3 Nano auf neuere große Modelle wie Nemotron Ultra und erweitert damit den Anwendungsbereich seiner Optimierungstechnologien weiter.

„Die Annahme dieses Beitrags spiegelt die kontinuierlichen Fortschritte von Nota AI bei MoE-spezifischen Quantisierungstechnologien wider", sagte Myungsu Chae, CEO von Nota AI. „Nach unserem Gesamtsieg beim NVIDIA Nemotron Hackathon freuen wir uns, unsere Forschungsergebnisse auf dem ICML 2026 AdaptFM Workshop zu präsentieren. Wir werden weiterhin Optimierungstechnologien entwickeln, die einen effizienteren und praktischeren Einsatz großer KI-Modelle ermöglichen."

Darüber hinaus wird Nota AI während der ICML 2026 im COEX in Seoul die „Nota AI – Korea Efficient Days" veranstalten. Die Veranstaltung bringt globale Forscher, Ingenieure und Führungskräfte aus der Wirtschaft zusammen, die Korea besuchen, um Forschungstrends und industrielle Anwendungen von Efficient AI auszutauschen. Im Rahmen der Veranstaltung plant Nota AI, seine Forschungsergebnisse zur Optimierung groß angelegter KI-Modelle vorzustellen und Möglichkeiten für technische Zusammenarbeit und geschäftliche Kontakte zu erweitern.

View original content to download multimedia:https://www.prnewswire.com/de/pressemitteilungen/nota-ai-hat-zwei-beitrage-zur-moe-quantisierung-fur-den-icml-2026-workshop-eingereicht-und-beweist-damit-seine-weltweite-wettbewerbsfahigkeit-bei-der-optimierung-groW-angelegter-ki-projekte-302798010.html

Nota AI hat zwei Beiträge zur MoE-Quantisierung für den ICML 2026 Workshop eingereicht und beweist damit seine weltweite Wettbewerbsfähigkeit bei der Optimierung groß angelegter KI-Projekte

Other news

Zürich-Einsatz für Trump Jr.: Warum der Bund statt der Veranstalter zahlt

Angst vor Chaos: Schweizer Sozialpartner gegen Zuwanderungsdeckel

Erdbebensicher und klimatisiert: Berner Marie-Colinet-Haus bereit für Wiedereröffnung

IFRS-Umstellung und Kingfluencers-Integration treiben naoo AG voran

Zürich-Einsatz für Trump Jr.: Warum der Bund statt der Veranstalter zahlt