DeepSeek 旗舰模型 V4 Pro/Flash 发布,1.6T 参数,百万上下文,开源! 发表于: 2026-04-24 分类于: 编程 评论: 约中午 12 点左右发布 DeepSeek-V4 模型,分为预览版 Preview、旗舰版 Pro 和快速版 Flash。 DeepSeek-V4 Preview: 开放预览版,支持 100 万高效上下文。 DeepSeek-V4-Pro: 1.6T 总参数,激活参数 49
Pytorch Paper 发表于: 2025-11-04 分类于: 读书 评论: 摘要 Pytorch 是一款流行的深度学习开源框架,本文通过阅读其论文 PyTorch: An Imperative Style, High-Performance Deep Learning Library 来了解它的设计思想。 摘要部分总结了 Pytorch 的目标:兼顾易用性和速度,具备如下
如何保存书籍 发表于: 2025-10-02 分类于: 写作 评论: 引子 十一回家,发现家里书柜上的书籍,都放置了好多年了,自己检查了下,部分有些灰尘、泛黄,所以就想着找到一种方法,延长书籍的保存时间。 书籍容易
重磅!OpenAI 开源 gpt-oss 大模型,性能卓越免费商用 发表于: 2025-08-06 分类于: 编程 评论: 简介 大陆时间 2025.8.6 凌晨 3 点左右,OpenAI 发布了gpt-oss-120b 和 gpt-oss-20b 两款性能卓越的轻量级语言模型。他们具备如下特点: 智能体能力 (Agentic cap
ollama 大版本 0.10 发布,支持暴露网络和 UI 界面 发表于: 2025-07-26 分类于: 编程 评论: 简介 在 v0.9 大版本发布后 ,ollama 又陆续发布了几个小版本 v0.9.1~v0.9.6,以及近期发布的v0.10.0 大版本 v0.10.0发布的功
英语相关考试 发表于: 2025-06-23 分类于: 目标 评论: 本文主要讨论如何学习英语以及分析一些英语考试 英语能力 全球化和互联网的发展,英语对个人是非常重要的,它可以帮助我们获取更多的信息,拓宽视野。 对
ollama 0.9 发布,支持流式响应和推理模型 发表于: 2025-06-09 分类于: 编程 评论: 简介 Ollama 连发两个大版本,分别是 v0.8.0和v0.9.0,0.8 版本后直接发 0.9 大版本,中间没有小功能迭代。 在 0.8 版本中,ollama 支持工具调用流式响应(stream response with tool calls)。 在 0.9 版本中,ollama 增强了对推理模型的支持,支持开启和关闭模型的推理模式。
ollama 0.7 发布,新引擎支持多模态模型 发表于: 2025-05-16 分类于: 编程 评论: 简介 Ollama 发布大版本 v0.7.0,包括新的模型引擎,支持多模态大模型: Meta Llama 4 Google Gemma 3 Qwen 2.5 VL Mistral Small 3.10 其它视觉模型
qwen3 系列模型发布,深度思考,快速响应 发表于: 2025-04-29 分类于: 编程 评论: qwen3 概览 分为密集模型架构 (0.6B/1.7B/4B/8B/14B/32B) 和混合专家架构 (30B-A3B/235B-A22B) 混合思维模式:支持开启/关闭推理能力即思考模式和非思考模式,使用户能够根据具体任务控制模型进行思考的
2025 内容精粹 发表于: 2025-04-19 分类于: 写作 评论: 碎言碎语 如何学英语 去网上下载 20 分钟一段的,比如法国国际广播,你一个字一个字查字典,花几天的时间把它听写下来,可能好多好多页。然后呢,你再花 3