Posts

OpenClaw 配置新闻摘要助手

发表于： 2026-05-07 分类于：编程评论：

OpenClaw 龙虾很火，最近开始尝试本地部署一个小龙虾玩玩。安装过程很简单，根据官方文档-安装步骤直接脚本一键安装。 curl -fsSL https://openclaw.ai/install.sh | bash 安装过程中会根据提示确认一

大语言模型应用

发表于： 2026-05-03 分类于：编程评论：

提示词 MIT 提示词模板 - A prompt you can use in Claude to help build & launch apps, v/@milesdeutscher chatgpt-prompt-engineering-for-developers 新加坡政府科技局（GovTech）组织的首届 GPT-4 提示工程大赛冠军 Sheila Teo 写的《我是如何夺冠新加坡

DeepSeek 旗舰模型 V4 Pro/Flash 发布，1.6T 参数，百万上下文，开源！

发表于： 2026-04-24 分类于：编程评论：

约中午 12 点左右发布 DeepSeek-V4 模型，分为预览版 Preview、旗舰版 Pro 和快速版 Flash。 DeepSeek-V4 Preview: 开放预览版，支持 100 万高效上下文。 DeepSeek-V4-Pro: 1.6T 总参数，激活参数 49

重磅！OpenAI 开源 gpt-oss 大模型，性能卓越免费商用

发表于： 2025-08-06 分类于：编程评论：

简介大陆时间 2025.8.6 凌晨 3 点左右，OpenAI 发布了gpt-oss-120b 和 gpt-oss-20b 两款性能卓越的轻量级语言模型。他们具备如下特点：智能体能力 (Agentic cap

ollama 大版本 0.10 发布，支持暴露网络和 UI 界面

发表于： 2025-07-26 分类于：编程评论：

简介在 v0.9 大版本发布后，ollama 又陆续发布了几个小版本 v0.9.1~v0.9.6，以及近期发布的v0.10.0 大版本 v0.10.0发布的功

ollama 0.9 发布，支持流式响应和推理模型

发表于： 2025-06-09 分类于：编程评论：

简介

Ollama 连发两个大版本，分别是 v0.8.0和v0.9.0，0.8 版本后直接发 0.9 大版本，中间没有小功能迭代。

在 0.8 版本中，ollama 支持工具调用流式响应(stream response with tool calls)。

在 0.9 版本中，ollama 增强了对推理模型的支持，支持开启和关闭模型的推理模式。

ollama 0.7 发布，新引擎支持多模态模型

发表于： 2025-05-16 分类于：编程评论：

简介

Ollama 发布大版本 v0.7.0，包括新的模型引擎，支持多模态大模型：

qwen3 系列模型发布，深度思考，快速响应

发表于： 2025-04-29 分类于：编程评论：

qwen3 概览分为密集模型架构 (0.6B/1.7B/4B/8B/14B/32B) 和混合专家架构 (30B-A3B/235B-A22B) 混合思维模式：支持开启/关闭推理能力即思考模式和非思考模式，使用户能够根据具体任务控制模型进行思考的

Llama4 系列模型发布

发表于： 2025-04-06 分类于：编程评论：

要点

混合专家架构，原生支持多模态
发布 Llama 4 Scout和Llama 4 Maverick两款原生多模态大模型
支持 1000 万 Token 上下文，开辟了无限可能，包括多文档总结、解析大量用户活动以执行个性化任务以及在庞大的代码库上进行推理
Llama 4 Scout 有 17B 活跃参数，配备了 16 位专家，是同类中最好的多模态模型。可以完全嵌入到一个 NVIDIA H100 GPU 中运行
Llama 4 Maverick 同样有 17B 个活跃参数，但拥有 128 位专家。它在广泛的基准测试中超越了 GPT-4o 和 Gemini 2.0 Flash，并且在推理能力和编程等任务上与 DeepSeek v3 相比仅需不到一半的活跃参数就能达到相似的表现
Llama 4 Scout 和 Llama 4 Maverick 都是从 Llama 4 Behemoth 蒸馏而来，Llama 4 Behemoth 有 288B 参数，还在训练中，拥有 16 位专家，是目前最强大的模型之一，在多个 STEM 基准测试上超越了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro

DeepSeek 开源周六彩蛋-一套组合拳：成本 8.7 万，收入 56 万

发表于： 2025-03-01 分类于：编程评论：

2025 年 2 月 24 号-2 月 28 号，DeepSeek 开源了大模型领域的多个关键软件，推动 AGI 向前发展。

你以为这就结束了？今天 (3 月 1 号） DeepSeek 又给出了一份汇总性的内容，总结自己利用这些关键技术，构建自己的推理系统的。

先说结论：

平均 1 天使用 226.75 个计算节点，每个节点 8 张 H800，假设每块 H800 GPU 的租赁成本为每小时 2 美元，日均成本为 87072 美元。
如果所有 token 都按 DeepSeek-R1 价格计算，日均收益将达 562027 美元。

基本上压榨全部的 GPU 资源了。