Nvidia Chat with RTX umožní vytvářet a lokálně provozovat AI chatboty
Chat with RTX, který je nyní zdarma ke stažení, je technologická ukázka, která uživatelům umožňuje přizpůsobit chatbota jejich vlastnímu obsahu. Nástroj lze spustit pomocí GPU NVIDIA GeForce RTX řady 30 nebo vyšší s alespoň 8 GB VRAM. Ke svému chodu využívá metodu generování s podporou vyhledávání, software NVIDIA TensorRT-LLM i akceleraci pomocí NVIDIA RTX.
Uživatelé také mohou rychle a snadno připojit místní soubory v počítači jako datovou sadu k rozsáhlému jazykovému modelu s otevřeným zdrojovým kódem, například Mistral nebo Llama 2, a umožnit tak rychlé a kontextově relevantní odpovědi na dotazy.
Aplikace Chat With RTX přitom podporuje různé formáty souborů včetně textu, souborů PDF, DOC/DOCX a XML. Zadat však lze např. i adresu URL se seznamem videí na YouTube a aplikace načte přepisy videí ze seznamu videí, což umožní dotazovat se na obsah, kterého se týkají.
Technologická demoverze aplikace Chat With RTX vychází z referenčního projektu pro vývojáře TensorRT-LLM RAG dostupného na GitHubu. Vývojáři jej mohou použít k vývoji a nasazení svých vlastních aplikací založených na RAG pro RTX a akcelerovaných technologií TensorRT-LLM.
Další informace získáte např. zde.