14233130 aixcoder model 1712808031
77
aiXcoder 7B 代码大型语言模型的官方仓库
1年多前
1371177 gitwcx 1578949981
76
百度文心千帆大模型sdk,集成了百度大模型常用api,包括文心一言、Llama、ChatGLM2、VisualGLM、BLOOMZ-7B、OpenLLaMA-7B等
Java
1年前
9279694 shenzhi wang 1715412582
73
LLama3 中文大模型
1年前
12 mirrors 1578989292
63
DeepSeek-V3 是一个强大的 Mixture-of-Experts (MoE) 语言模型,它拥有671B个总参数,每个 token 有37B个激活参数
Python
6天前
6196683 tengxunkai 1591587685
61
随着模型规模的扩大,如何在保持高性能的同时优化资源消耗成为一个关键挑战。为了应对这一挑战,我们研究了混合专家(MoE)模型,当前亮相的Hunyuan-Large(Hunyuan-MoE-A50B)模型,这是目前业界待开源的基于Transformer的最大MoE模型,拥有3890亿总参数和520亿激活参数。
10个月前
57
CodeFuse-MFTCoder: Multitask Fine-Tuned Code LLMs
1年多前
1350936 grt1228 1676872126
57
讯飞星火大模型Java SDK 易开发,更灵活. Xun fei SparkDesk Java SDK. SparkDesk. xfyun SDK. xinghuo.星火.
Java
2年前
13683957 jiutian ai 1719886881
52
九天-139MoE-Chat是中国移动自主研发的语言大模型,实现数据构建、预训练、微调、部署全链路核心技术自主创新;行业定向增强,数据上融合通信、能源等8大行业专业知识,提供定制化行业大模型;安全可靠,建立数据质量评估体系,加强数据处理和清洗,优化DPO算法,加强人类价值观对齐,实现指令安全响应。该模型在主流公开测试集测评结果上,已达GPT-4的90%水平,适配国产算力生态,助力企业实现智能化产业
1年前
49
简单、高效且低成本的预训练、微调与服务,惠及大众
3个月前
12 mirrors 1578989292
40
ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型
Python
6天前
9090342 chairc 1646386758
40
IDDM(工业,景观,动画…),latent diffusion model,支持DDPM, DDIM, PLMS, web和多gpu分布式训练。Pytorch实现、生成模型、扩散模型、分布式训练
Python
10分钟前
5635863 ascend 1586517030
29
此仓库已转移,新仓见:https://gitee.com/ascend/mindxdl.git
5746888 paddlepaddle 1583115535
29
PaddleMIX是基于飞桨的多模态大模型开发套件,聚合图像、文本、视频等多种模态,覆盖多模态理解、多模态生成等丰富的多模态任务。它提供开箱即用的开发体验,同时支持灵活定制,高效完成各类多模态大模型任务,实现图像摘要、视频问答、动画制作能不同功能,助力探索通用人工智能。
2个月前
10597042 deep spark 1664386531
25
本仓库为天数智芯Iluvatar Corex IxRT高性能推理引擎的开源代码部分,提供IxRT相关插件、部署工具和演示IxRT平台用法和能力的应用示例。
5天前
6196683 tengxunkai 1591587685
18
Hunyuan-DiT : A Powerful Multi-Resolution Diffusion Transformer with Fine-Grained Chinese Understanding.
10个月前

搜索帮助