🚀 Neu: EmbeddingGemma – Googles bestes Small Embedding Model

Google hat ein neues Embedding-Modell veröffentlicht: EmbeddingGemma.
👉 300M Parameter, speziell optimiert für Retrieval Augmented Generation (RAG).

Besonders spannend: Mit Ollama lässt sich das Modell in wenigen Minuten lokal nutzen – extrem schnell und effizient, vor allem auf NVIDIA GPUs.

So einfach geht’s:

ollama pull embeddinggemma

🔗 Hier ausprobieren

Wenn du also ein leichtgewichtiges, aber starkes Embedding-Modell für RAG-Projekte suchst, lohnt sich ein Blick auf EmbeddingGemma definitiv. 💡

Allgemein

AI direkt auf deinem Gerät: SQLite-Vec + EmbeddingGemma

sven
7. September 2025
2 min read
0

Wusstest du, dass SQLite mittlerweile eine Vector-Extension hat? 🧮SQLite ist die weltweit am häufigsten genutzte Datenbank und läuft praktisch auf […]

Allgemein

2 Podcast-Empfehlungen zu RAG

sven
19. Februar 2025
1 min read
0

Beide Folgen sind u.a. auf Spotify zu finden RAG im INNOQ Podcast (Link zur Folge) Zuverlässige KI-Architektur im Podcast SoftwareArchitekTOUR […]

Allgemein

Generative AI for Beginners – Microsoft-Kurs mit 21 Lektionen

sven
8. September 2025
2 min read
0

Einführung Microsoft hat auf GitHub den Open-Source-Kurs „Generative AI for Beginners“ veröffentlicht – eine leicht zugängliche Einführung in generative KI. […]

Allgemein

Tencent bringt zwei neue Open-Source Übersetzungsmodelle – und was sie in der Praxis leisten können

sven
13. September 2025
3 min read
0

Tencent hat mit Hunyuan-MT-7B und Hunyuan-MT-Chimera-7B zwei Open-Source Übersetzungsmodelle veröffentlicht, die in Benchmarks selbst Google Translate, GPT-4.1 und Claude 4 […]

Related Posts

AI direkt auf deinem Gerät: SQLite-Vec + EmbeddingGemma

2 Podcast-Empfehlungen zu RAG

Generative AI for Beginners – Microsoft-Kurs mit 21 Lektionen

Tencent bringt zwei neue Open-Source Übersetzungsmodelle – und was sie in der Praxis leisten können