K2

专精地球科学的开源大语言模型

7 浏览

2026年4月27日

K2介绍

K2是由上海交通大学推出的面向地球科学领域的开源大语言模型，基于LLaMA架构进行深度定制化开发。该模型首先在大量清洗后的地球科学文献（包括开放获取论文与维基百科相关内容）上完成领域自适应预训练，随后利用专为地质、地理和环境科学设计的知识密集型指令数据集GeoSignal进行精细化微调。在GeoBenchmark基准测试中，K2（7B参数量）在客观题与主观问答任务上均显著优于同规模的通用模型，展现出优异的领域理解与推理能力。作为完全开源项目，K2同步公开训练代码、数据处理流程及评估工具，支持科研复现与二次开发，是地球科学AI研究与教育的重要基础设施。

K2网站截图

K2的主要功能

专精地球科学领域的语言理解与生成能力
基于LLaMA架构的开源可复现模型实现
支持地质学、地理学、环境科学等多学科知识推理
集成GeoBenchmark评估体系，提供标准化性能验证
开放全部训练代码、指令数据集GeoSignal及预处理脚本

K2如何使用

1访问官方资源库获取K2模型权重与代码仓库
2配置Python环境并安装依赖项（如transformers、accelerate）
3加载模型并使用Hugging Face接口进行本地推理或微调
4基于GeoSignal数据格式准备自有指令数据，开展增量训练
5运行GeoBenchmark测试套件评估模型在专业任务上的表现

K2的应用场景

高校地球科学课程教学辅助与智能答疑
科研人员快速检索与归纳海量地学文献核心结论
地质调查报告自动生成与术语标准化校对
环境政策分析中跨文本因果关系提取与推演
地理信息系统（GIS）平台嵌入式智能问答模块开发

K2

K2介绍

K2网站截图

K2的主要功能

K2如何使用

K2的应用场景

标签

相关推荐

热门工具

最新收录

精选工具