Hey, miles

莫等闲,白了少年头q

0%

openai/evals: Evals is a framework for evaluating LLMs and LLM systems, and an open-source registry of benchmarks. (github.com)

评估

  • 训练后,联合专家对模型在多方面评估,可以包括long-term AI对齐风险领域,电子安全领域,生物安全领域,以及互联网安全领域等

调优

  • 模型调优的目的:1. 将模型的表现与我们的预期更好地对齐;2. 让模型能合理拒绝不安全的输入,回答安全输入

reward model

PPO

terms:

toxicity: 模型的有毒性主要指大模型会产生的攻击性、有害的内容。这些内容的产生与语言模型之间存在割裂性。因为语言模型不具有感情,只是基于概率去处理和产生文本内容,但是这些文本内容却可能会伤害到一些人。

GPT-4 Technical Report Translation

OpenAI (2023)

Abstract

我们报道了GPT-4的发展,一个大尺度(large-scale),多模态,可以接受图像、文本输入,生成文本输出。GPT-4虽然在很多实际场景中的表现不如人类,但是GPT-4在多种包括专业和学术基准测试上表现出了人类水平的能力,包括在所有测试者中以前10%的成绩通过美国律师资格考试(bar exam)。GPT-4是一个Transformer-based的模型,通过预训练来预测文件中的下一个token。post-tr1aining alignment流程提升了factuality以及adherence的性能到想要的表现。这个项目的核心组件是开发能够在很大的范围内可预测地运行的infrastructure以及优化方法。这允许我们使用小于GPT-4$ \frac{1}{1000th} $计算量的方式准确地预测GPT-4一些方面的性能。

阅读全文 »

今天继续上班,干了件没脑子的事情,中午的时候军哥他们说BYD的车怎么样,然后我就插话说去年收到的BYD的offer,然后透露到当时offer的工资说工资低,然后就伤到人了。然后因为这事想了一下午,感觉说话还是得小心,言多必失啊。话虽如此,平时得多锻炼自己说话的能力,这样关键场合才能说得更稳当一些嘛,犯错了及时补救,脑袋多想想。

摘抄几句这两天一直在听的歌词,很喜欢,感觉道出了最近的一些心情:

Just want to know my little flicker of time is worthwhile.

And I don’t know where I’m driving to

But I know I’m getting old.

​ —— Homecomming (Walter’s Song) by Vienna Teng

祝好,加油!

今天是国庆节假期后的第四天,周二,好像时间也挺快的,但是还有三天才到周六周日。

阅读全文 »

Notes on Noise Contrastive Estimation and Negative Sampling

摘要

MIMO雷达是提升mmwave雷达角度分辨率(空间分辨率)的关键技术。本文介绍了MIMO雷达的基本原则以及不同设计的可能性。本应用报告也简短地讨论了提升TI毫米波产品线上MIMO雷达的方式。

阅读全文 »

摘要

这篇应用报告展示了如何转译使用Capture Demo或者Mmwave Studio采集到的原始ADC数据。单独讨论了使用不同硬件配置采集到的原始ADC数据的格式。对于需要开发自制代码进行数据处理的工程师提供了Matlab snippet。

阅读全文 »

摘要

本应用报告提供了有关如何根据最终应用和用例在快速 FMCW 雷达设备中选择正确chirp参数的信息,并在 TI 的雷达设备上对其进行优化编程。

阅读全文 »

cannot assign module before Module.__init__() call

阅读全文 »