Google hat ein neues Embedding-Modell veröffentlicht: EmbeddingGemma.
👉 300M Parameter, speziell optimiert für Retrieval Augmented Generation (RAG).
Besonders spannend: Mit Ollama lässt sich das Modell in wenigen Minuten lokal nutzen – extrem schnell und effizient, vor allem auf NVIDIA GPUs.
So einfach geht’s:
ollama pull embeddinggemma
đź”— Hier ausprobieren
Wenn du also ein leichtgewichtiges, aber starkes Embedding-Modell fĂĽr RAG-Projekte suchst, lohnt sich ein Blick auf EmbeddingGemma definitiv. đź’ˇ