| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
原始链接: https://news.ycombinator.com/item?id=38974802
作者讨论说,虽然法学硕士由于限制其行动的护栏而可能不会对自主行为者构成直接危险,但令人担忧的是,这些人严重依赖法学硕士的产出和建议而不对其进行批判性评估的个人可能会受到影响。 人类可能会盲目相信人工智能的建议和决策能力,从而在教育、医疗、就业等领域产生重大后果。 因此,解决这个问题需要考虑为 ALM 开发和检查创建审计跟踪,以审查其固有知识、动机以及与其宣传目的的潜在偏差。 虽然目前尚不清楚检查如何在这方面发挥作用,但探索动态调整训练条件以开发自我评估模型的可能性可能有助于调查。 尽管如此,找到切实可行的方法来确保可靠的数据来源并避免关键部门对法学硕士系统的广泛依赖是防止法学硕士引起的不当影响的重要策略。 最终,问题围绕着确保优先考虑值得信赖的法学硕士输出,这涉及审查这些模型如何在整个培训阶段获取和保留知识和信息。
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
![]() |
It warned me that spreading neo-feudalism wasn't a common or widespread goal, and that advocating for it required careful consideration. But it nevertheless made an attempt to help me do it.
I mention this because attacks on LLMs don't have to be as clever as the modern-day version of the Ken Thompson compiler attack. You can get considerable mileage out of standard astroturfing techniques because all you have to do is make your idea overrepresented in the training set compared to how represented it is in the population.
That overrepresentation will tend to grow over time because people will hear the ideas from the LLM and assume the LLM knows what it's talking about. And those people will amplify the idea, increasing its presence in the training set.
reply