超清晰Ollama 部署大模型后4 种最常用通信方式直接复制就能用我用最简单、最落地的方式告诉你Ollama 启动后 自动开启一个本地 API 服务。默认地址http://localhost:11434所有通信都通过这个地址调用支持对话、流式输出、函数调用、多模态看图、ROS / 机器人集成。0. 先确认 Ollama 运行正常bash运行ollama serve看到Listening on 127.0.0.1:11434就成功了。1. 最常用HTTP API所有语言都能用1对话请求非流式地址POST http://localhost:11434/api/generate示例curl直接复制运行,curl启动一个Http客户端访问bash运行curl http://localhost:11434/api/generate -d { model: qwen:7b, prompt: 你好请介绍一下你自己 }2聊天格式推荐地址POST http://localhost:11434/api/chatbash运行curl http://localhost:11434/api/chat -d { model: qwen:7b, messages: [ {role: user, content: 你好} ] }2. 最丝滑流式输出实时打字效果机器人对话、实时交互必须用流式。只需加一个参数stream: true示例bash运行curl http://localhost:11434/api/chat -d { model: qwen:7b, stream: true, messages: [ {role: user, content: 写一段机器人运动控制逻辑} ] }返回结果会一个字一个字输出延迟极低。3.Python 调用机器人 / 自动化最常用复制下面代码直接运行就能通信python运行import requests url http://localhost:11434/api/chat data { model: qwen:7b, messages: [ {role: user, content: 你好你是谁} ] } response requests.post(url, jsondata) print(response.json()[message][content])流式 Python 版本推荐python运行import requests # http请求库 url http://localhost:11434/api/chat data { model: qwen:7b, stream: True, messages: [ {role: user, content: 告诉我如何控制机器人关节} ] } # 实时接收输出 with requests.post(url, jsondata, streamTrue) as r: for chunk in r.iter_lines(): print(chunk)4. JavaScript / 前端 / 网页调用jsconst response await fetch(http://localhost:11434/api/chat, { method: POST, body: JSON.stringify({ model: qwen:7b, messages: [{ role: user, content: 你好 }] }) }); const result await response.json(); console.log(result.message.content);5. 机器人场景ROS2 对接 Ollama超级常用步骤启动 Ollama写一个 ROS2 节点订阅文本指令 → 发给 Ollama → 返回结果 → 发给控制模块极简可运行代码python运行import rclpy from rclpy.node import Node import requests # HTTP请求库通过该库发起HTTP请求。 class OllamaNode(Node): def __init__(self): super().__init__(ollama_node) self.url http://localhost:11434/api/chat def ask(self, prompt): # 该节点通过requests库与ollma管理的大模型进行http通信 # 通过该函数把请求转化成http格式并童工requests库发起HTTP请求 # 大模型在 http://localhost:11434/api/chat。等待别人的请求。 data { model: qwen:7b, messages: [{role: user, content: prompt}] } res requests.post(self.url, jsondata) return res.json()[message][content] def main(argsNone): rclpy.init(argsargs) node OllamaNode() print(node.ask(你好)) rclpy.shutdown()6. 多模态模型看图对话如果部署的是llava/qwen-vl等多模态bash运行curl http://localhost:11434/api/generate -d { model: llava, prompt: 这张图里有什么, images: [base64编码图片] }7. 最简单总结记这个就够Ollama 部署后 本地 11434 端口 API 服务通信方式只有一句话发送 POST 请求 → http://localhost:11434/api/chat支持非流式流式实时输出Python/JS/Java/CROS/ROS2多模态看图函数调用