Skip to content

Ollama

July 28, 2025
in 案例, AI, IPEX-LLM, Ollama, 智能助手

英特尔“芯”AI，赋能云边端｜第七期：5000元 Ultra RAG 增强 30B 大模型，智启企业 AI 新纪元

经过前六期的探索，YiCoreAI 平台已通过 YIAISTUDIO 的高效训练（Arc A770 驱动 YOLOv8/v11 和 Qwen-7B）、YiCONNECT 的 Kubernetes 管理，以及 YiEDGE 的 Core Ultra NPU 40ms 延迟推理，构建了强大的云边端 AI 闭环。第五期我们在 Ultra 5 125H iGPU 上部署 MedGemma 4B IT，第六期借助 Ollama 优化 Qwen3:8B。如今，第七期我们迈向新高度：5000 元 Core Ultra 5 125H 笔记本融合 RAG 技术，增强 30B 大模型，助力企业实现智能化转型。

July 14, 2025
in 案例, AI, LLM, Ollama, 解决方案

英特尔“芯”AI，赋能云边端｜第六期：使用 Ollama 在 Core Ultra 高效部署 Qwen3:8b

自第一期起，YiCoreAI 平台凭借 YIAISTUDIO 利用 Arc A770 GPU 高效训练 YOLOv8/v11 和 Qwen-7B，到 YiCONNECT 基于 Kubernetes 实现智能管理，再到 YiEDGE 依托 Core Ultra NPU 实现 40ms 延迟推理，逐步构建云边端 AI 闭环。第五期更在 Ultra 5 125H iGPU 上部署 MedGemma 4B IT，验证便携性。

第六期，Ollama 驱动 Qwen3:8b 在 Core Ultra 上实现高效部署，延迟低至 35ms，准确率超 85%，功耗优化显著，赋能教育心理健康和医疗诊断。