部分收集业界开放的代码编程助手相关的产品信息,并进行一些差异性分析。
Aug 30, 2024
记录一些在实践代码大语言模型过程中的经验和总结,本篇是关于代码大语言基座模型的相关内容,包括部分经典的代码大语言模型、以及对应的训练数据集和训练策略等信息的收集,其中StarCoder, Deepseeker Coder 以及 CodeLlama 占据相对较多的介绍篇幅。内容均来源于公开论文,不涉及商业敏感信息。
Jan 7, 2024
坚持阅读的习惯,坚持捕获阅读时刻的灵光一现,温故而知新。
Jan 1, 2024
记录一些在实践代码大语言模型过程中的经验和总结,本篇是关于代码测评的相关内容,包括代码测评关键指标、常用公开 benchmark 数据集等。
Dec 21, 2023
记录了一些使用Pandas 进行分组聚合相关操作的总结,包括groupby分组, transform, 以及explode等操作。持续发现Pandas的中高效操作
Sep 18, 2022
把个人站点从wordpress 迁移到了hugo。 本文主要记录hugo使用过程中的一些配置信息
Sep 3, 2022
基于policy gradient的强化学习方法的梳理总结,从经典的策略梯度算法开始,讨论A3C,DDPG,PPO,以及IMPALA等系列算法的基本思想和实现。
Jun 13, 2019
AI系统构建的简要总结,包括业务模型训练及在线serving的关系。
Jun 1, 2019
基于dqn 的强化学习方法的梳理总结,从经典的DQN算法开始,总结不同方法的改进策略,到集大成者Rainbow算法。
May 13, 2019
梳理当前经典的强化学习开源库, 以及一些经典的仿真环境。
Apr 23, 2019