手把手教你用 Ollama 在本地部署大模型:无需 GPU,10 分钟跑通 Llama 3!

简介: 想本地运行Llama 3、Mistral、Gemma、Qwen等开源大模型?Ollama一键部署,支持离线使用、无需GPU,数据不外泄。命令行+API调用,轻松构建私有AI应用!

想在自己的电脑上免费运行 Llama 3、Mistral、Gemma、Qwen 等开源大模型?
不想依赖 API、不担心隐私泄露、还能离线使用?
Ollama 就是你的最佳选择!
Ollama 是一个专为本地运行大语言模型(LLM)设计的开源工具,支持 macOS、Linux 和 Windows(WSL),一键拉取、一键运行,极大简化了本地部署流程。
今天,我们就从零开始,手把手教你用 Ollama 在本地部署并调用大模型!

一、什么是 Ollama?

✅ 开源免费,本地运行,数据不出内网;
✅ 支持主流开源模型:Llama 3、Mistral、Phi-3、Gemma、Qwen、Yi 等;
✅ 自动管理模型下载、量化、推理;
✅ 提供命令行交互 + REST API + Web UI(通过第三方);
✅ 支持 CPU 推理(无需 GPU,但有 GPU 会更快)。

二、安装 Ollama

Linux

curl -fsSL https://ollama.com/install.sh | sh

macOS(推荐 M1/M2/M3 芯片)

brew install ollama

三、运行第一个模型:Llama 3

Ollama 内置模型库,只需一条命令即可下载并运行!

ollama run llama3

首次运行会自动下载 Llama 3 8B(约 4.7GB,量化版),下载完成后进入交互模式:

>>> 你好!
你好!有什么我可以帮你的吗?
>>> 用 Python 写一个快速排序
...

✅ 支持中文、代码生成、逻辑推理等任务!

四、常用命令速查

命令 说明
ollama run 运行指定模型(如 llama3, mistral, qwen:7b)
ollama list 查看已下载的模型
ollama pull 手动下载模型(不立即运行)
ollama rm 删除模型
ollama ps 看正在运行的模型进程

五、通过 API 调用模型(供程序集成)

Ollama 启动后会自动开启 本地 REST API(默认 http://localhost:11434)。
示例:用 Python 调用 Llama 3

import requests

response = requests.post(
    'http://localhost:11434/api/generate',
    json={
   
        "model": "llama3",
        "prompt": "用一句话解释量子计算",
        "stream": False
    }
)

print(response.json()['response'])

输出:

量子计算利用量子比特的叠加和纠缠特性,实现远超经典计算机的并行计算能力。
API 说明
端点:POST /api/generate
参数:
model: 模型名称
prompt: 输入提示
stream: 是否流式输出(False 返回完整结果)
返回:JSON 格式,response 字段为模型输出

结语

Ollama 让大模型本地化变得前所未有的简单。无论你是开发者、研究员,还是 AI 爱好者,都可以在自己的电脑上:

  • 私有化部署大模型;
  • 构建本地 AI 应用;
  • 学习 LLM 原理;
  • 保护数据隐私。
相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
目录
相关文章
|
2月前
|
存储 监控 数据可视化
大模型可观测1-5-10:发现、定位、恢复的三层能力建设
本文通过丰富的代码Demo和截图为读者提供了可落地的实践指南。
445 34
大模型可观测1-5-10:发现、定位、恢复的三层能力建设
|
6天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:十、开箱即见 Gradio:大模型的“魔法画布”,让每一个想法清晰可见
Gradio是一个快速构建机器学习演示界面的Python库,能够将需要数天开发工作的模型展示缩短为几分钟的脚本编写。它通过简单的Python代码即可生成完整的Web应用界面,支持文本、图像、音频等多种交互组件,适用于模型展示、教学演示和原型测试等场景。文章详细介绍了Gradio的核心功能、基础语法和组件使用方法,并通过情感分析和聊天机器人两个实际案例展示了如何快速部署AI模型交互界面。Gradio大幅降低了将模型转化为可交互应用的门槛,使开发者能更专注于模型本身而非界面开发。
139 7
|
28天前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
613 1
|
4天前
|
人工智能 数据可视化 前端开发
震惊,Github开源,真正让程序员效率提升 90%的AI辅助工具来啦!!!
Claude Code Viewer 是一款开源浏览器工具,将 Claude Code 的终端日志可视化,支持会话管理、Git Diff 查看、文件预览与定时任务,实现远程交互与多项目导航,提升 AI 编程效率。
106 0
|
7天前
|
缓存 PyTorch API
TensorRT-LLM 推理服务实战指南
`trtllm-serve` 是 TensorRT-LLM 官方推理服务工具,支持一键部署兼容 OpenAI API 的生产级服务,提供模型查询、文本与对话补全等接口,并兼容多模态及分布式部署,助力高效推理。
251 155
|
23天前
|
文字识别 自然语言处理 API
同时斩获两个开源第一,超火的通义Qwen3-VL CookBook来了
Qwen3-VL开源发布后广受认可,登顶Chatbot Arena视觉榜与OpenRouter图像处理市场份额第一。支持文档解析、OCR、视频理解、3D定位等多模态任务,现推出详细Cookbook助力开发者高效应用。
434 3
|
6天前
|
存储 安全 数据库
一文搞懂 AES 加密:现代对称加密的黄金标准
AES是全球最广泛使用的对称加密算法,高效安全,广泛应用于HTTPS、移动应用、数据库等场景。本文带你了解其原理、Python实现及与RSA的协同使用,掌握数据保护核心技术。#AES #数据加密 #信息安全
234 7
|
15天前
|
人工智能 API 开发工具
构建AI智能体:一、初识AI大模型与API调用
本文介绍大模型基础知识及API调用方法,涵盖阿里云百炼平台密钥申请、DashScope SDK使用、Python调用示例(如文本情感分析、图像文字识别),助力开发者快速上手大模型应用开发。
522 16
构建AI智能体:一、初识AI大模型与API调用