列表页

全部分类 >> 大数据和云计算 >> >数据存储

CleanRL 深度强化学习库

CleanRL 是一个深度强化学习库，提供具有研究友好功能的高质量 single-file 实现。该实现简洁明了，但我们可以使用 AWS Batch 对其进行扩展以运行数千次实验。CleanRL...<
ByteCraft AI 生成可执行的二进制文件

ByteCraft 是通过在 4 个 GPU 上对 7B 参数的LLM（Qwen2.5）进行微调，以 32K 的生成上下文长度训练了 4 个月，用于生成基于文本描述的视频游戏和动画的二进制文件。...<
Minesweeper MCP Server 扫雷 MCP 服务器

Minesweeper MCP Server 是一个扫雷 MCP 服务器，让 Claude 可以玩扫雷游戏。<
Simple MNIST Neural Network 用于 MNIST 数字识别的纯前馈神经网络实现

simple_mnist 是一个用于 MNIST 数字识别的纯前馈神经网络实现，完全用 C 语言编写。该实现在 MNIST 测试集上实现了超过 99%的准确率，且未使用卷积层。这个项目证明了...<
AlexNet 人工神经网络

AlexNet 是一个人工神经网络，用于识别照片内容。它由当时的多伦多大学研究生 Alex Krizhevsky 和 Ilya Sutskever 以及他们的导师 Geoffrey Hinton...<
SWE-RL 基于强化学习增强 LLM 推理能力

SWE-RL：通过开源软件演进数据和基于规则的奖励机制，增强 LLM 推理能力的强化学习项目。特性首个针对真实世界软件工程的强化学习方法提供奖励函数和提示模板，助力开发者快速上手支持Ag...<
jepa-intuitive-physics 针对物理理解的自监督预训练

jepa-intuitive-physics：通过自然视频的自监督预训练，让机器学会直观物理理解。特性利用自监督学习，无需标注数据即可训练提供完整的代码和数据，可复现论文结果支持多种模型...<
Megatron-VLM 视觉语言模型训练框架

Megatron-VLM是为视觉语言模型（VLM）训练定制的高效框架。特性支持大规模分布式训练，显著提升训练效率提供多种预训练模型支持，如BERT、GPT和T5 高效的内存优化技术，降低训练成本<
Open Gemini Deep Research 基于 Gemini 的深度研究助手

Open Gemini Deep Research 是基于谷歌 Gemini AI 的深度研究助手，一键生成高质量研究报告。特性三种研究模式（快速、平衡和全面），满足不同需求自动生成 30...<
GeneralistYOLO 实时多任务视觉语言模型

GeneralistYOLO 是一个实时多任务视觉语言模型，一站式解决多种视觉任务。特性单模型支持目标检测、分割、图像描述等多任务 MS COCO数据集上目标检测AP达52.4%，实例分割A...<

本周排行本月排行