模型广场

已选筛选: 文本 × 65536 Tokens × 清除全部
MiniMax
MiniMax 免费 文本 编程 推理
活跃
MiniMax M2.7

MiniMax M2.7 是一款面向复杂软件工程、智能体工具调用以及办公生产力流程的大语言模型。该模型深度参与自身的演化过程,支持复杂的智能体编排、动态工具搜索、智能体团队协作,以及高保真度的编码与文档编辑任务。

输入价格
¥0.0000
/千Token
输出价格
¥0.0000
/千Token
参数量
230B
上下文限制
200K Tokens
速率限制
-
?
其他 免费 文本 编程 推理
活跃
阶跃星辰Step-3.5-Flash

Step 3.5 Flash 是由 StepFun 开发的一款稀疏混合专家(MoE)大语言模型,旨在以卓越的效率提供前沿推理与智能体能力。该模型总参数量为 1968.1 亿,但每个 token 仅激活约 110 亿参数,在具备顶级模型推理深度的同时,仍能保持 100-300 token/秒(编码任务峰值可达 350 token/秒)的吞吐量,实现实时响应。

输入价格
¥0.0000
/千Token
输出价格
¥0.0000
/千Token
参数量
196.81B
上下文限制
250K Tokens
速率限制
-
智谱AI
智谱AI 免费 文本
活跃
GLM-4-Flash-250414

GLM-4-Flash-250414 语言模型是 智谱AI 首个免费的大模型 API,它在实时网页检索、长上下文处理、多语言支持等方面表现出色,适用于智能问答、摘要生成和文本数据处理等多种应用场景。

输入价格
¥0.0000
/千Token
输出价格
¥0.0000
/千Token
上下文限制
128K Tokens
速率限制
-
智谱AI
智谱AI 免费 文本
活跃
GLM-4.7-Flash

GLM-4.7-Flash 作为 30B 级 SOTA 模型,提供了一个兼顾性能与效率的新选择。面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同,并在多个公开基准的当期榜单中取得同尺寸开源模型中的出色表现。在执行复杂智能体任务,在工具调用时指令遵循更强,Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。

输入价格
¥0.0000
/千Token
输出价格
¥0.0000
/千Token
参数量
30B
上下文限制
200K Tokens
速率限制
-
深度求索
深度求索 付费 文本
活跃
DeepSeek V4 Pro

深度求索最新旗舰,在长文本推理上有显著优势

输入价格
¥0.5000
/千Token
输出价格
¥2.0000
/千Token
参数量
1600B
阿里云
阿里云 免费 文本 编程
活跃
Qwen3-Coder-480B-A35B-Instruct

Qwen3-Coder-480B-A35B-Instruct 是一款专为代码生成与智能体编码任务设计的最先进的大语言模型。该模型采用混合专家(MoE)架构,总参数量为 4800 亿,激活参数量为 350 亿,原生支持 262,144 个 token 的上下文长度,并可通过 YaRN 方法扩展至 100 万个 token。

输入价格
¥0.0000
/千Token
输出价格
¥0.0000
/千Token
参数量
480B
上下文限制
256K Tokens
速率限制
-
模型详情

-

-

-

-
输入价格 - /1K Tokens
输出价格 - /1K Tokens