MasterKe

AI大模型专业术语

蒸馏:DeepSeek提供的1.5B~70B的小参数R1模型是通过”蒸馏”产生的。蒸馏是一个知识迁移的过程,以其他开源模型(如qwen、llama)作为基座,用DeepSeek-R1大模型对这些模型进行训练,让这些参数较小的模型学习R1的生成结果、思考过程等,在显著降低模型参数规模的同时能保留一定的性能和精度。 量化:量化是大模型领域中的一项关键技术,它通过降低模型参数的精度,将浮点数转换...

Docker镜像构建中使用cache机制对依赖进行复用

在docker中进行构建,然后打包运行,得益于其分阶段构建的特性,能够在控制镜像大小的情况下很好的保持环境一致性的特性。但是docker的机制也使得每次有代码变动之后都必须重新下载依赖,而无法使用maven仓库的本地缓存,导致每次构建都需要很长时间,例如下面的20分钟: 其实这个问题很好解决,借助docker的cache机制,如果没有变动的层会直接使用缓存,因此我们可以将pom.xml...

工作规划

工作总结 系统运维 windows定制镜像管理平台 系统运维工单系统 AI知识库问询系统 网络运维 监控运维 工作日志 2025-2-12【周三】 今天第一天报道,上午看了一下科室工作规范等等的文档,下午还是看文档。 不过不得不感叹大企业文档OA流程这些真的是很规范,每个人都必须严格遵守,不然真的要乱成一锅粥了。个人觉得要是有求知欲的话这个平台还是能提供给你很多学...