未命名

发表于 2023-11-05 更新于 2023-11-21 Valine：
本文字数： 352 阅读时长 ≈ 1 分钟

openai/evals: Evals is a framework for evaluating LLMs and LLM systems, and an open-source registry of benchmarks. (github.com)

评估

训练后，联合专家对模型在多方面评估，可以包括long-term AI对齐风险领域，电子安全领域，生物安全领域，以及互联网安全领域等

调优

模型调优的目的：1. 将模型的表现与我们的预期更好地对齐；2. 让模型能合理拒绝不安全的输入，回答安全输入

reward model

PPO

terms:

toxicity: 模型的有毒性主要指大模型会产生的攻击性、有害的内容。这些内容的产生与语言模型之间存在割裂性。因为语言模型不具有感情，只是基于概率去处理和产生文本内容，但是这些文本内容却可能会伤害到一些人。

44-LLM

发表于 2023-10-22 更新于 2023-11-19 Valine：
本文字数： 33k 阅读时长 ≈ 30 分钟

GPT-4 Technical Report Translation

OpenAI (2023)

¶Abstract

我们报道了GPT-4的发展，一个大尺度(large-scale)，多模态，可以接受图像、文本输入，生成文本输出。GPT-4虽然在很多实际场景中的表现不如人类，但是GPT-4在多种包括专业和学术基准测试上表现出了人类水平的能力，包括在所有测试者中以前10%的成绩通过美国律师资格考试(bar exam)。GPT-4是一个Transformer-based的模型，通过预训练来预测文件中的下一个token。post-tr1aining alignment流程提升了factuality以及adherence的性能到想要的表现。这个项目的核心组件是开发能够在很大的范围内可预测地运行的infrastructure以及优化方法。这允许我们使用小于GPT-4$ \frac{1}{1000th} $计算量的方式准确地预测GPT-4一些方面的性能。

阅读全文 »

43-essay.md

发表于 2023-10-11 Valine：
本文字数： 342 阅读时长 ≈ 1 分钟

今天继续上班，干了件没脑子的事情，中午的时候军哥他们说BYD的车怎么样，然后我就插话说去年收到的BYD的offer，然后透露到当时offer的工资说工资低，然后就伤到人了。然后因为这事想了一下午，感觉说话还是得小心，言多必失啊。话虽如此，平时得多锻炼自己说话的能力，这样关键场合才能说得更稳当一些嘛，犯错了及时补救，脑袋多想想。

摘抄几句这两天一直在听的歌词，很喜欢，感觉道出了最近的一些心情：

Just want to know my little flicker of time is worthwhile.

And I don’t know where I’m driving to

But I know I’m getting old.

—— Homecomming (Walter’s Song) by Vienna Teng

祝好，加油！