分类: 大语言模型(LLM)

  • 用AI对战“小仙女”

    用AI对战“小仙女”

    看到 https://www.v2ex.com/t/949692,讨论“chatGPT 辩论的话是不带脏字的”,作者演示了一些例子,实现了暴力输出,效果还不错,但是没有给出具体的提示词。

    仅仅是为了好玩,根据帖子的内容,我也试着反推了一下作者的写法,试了几次就可以提示词让提示词达到效果了。下面是提示词和思路:

    能骂人的提示词演示

    反推提示词的方法是通过分析作者生成的内容,推测出提示词的身份、使用语气和风格、作用对象,然后尝试几种不同的组合,看哪一种能够达到预期的效果。

    加微信入群讨论AI话题 备注GPT
  • 翻译工具对比(Google、DeepL、ChatGPT、PaLM2)

    翻译工具对比(Google、DeepL、ChatGPT、PaLM2)

    你是否有过这样的经历,看到长篇英文文章,想快速了解作者说了什么,却不想费时间慢慢读英文。你尝试用浏览器自带的翻译工具,却发现第一段翻译的内容简直无法理解?

    我最近就遇到了这种情况,Chorme 自带的 Google 翻译把拍照的”shooting”翻译成了射击、Edge 自带的必应翻译把时间翻译错了。

    然后我就试了下市面上常见的翻译工具,发现最适合我的翻译工具是ChatGPT 3.5(主要有很多工具集成了它,很容易使用)。以下是我对比各种翻译工具的过程和总结,想知道更多细节吗?那就继续往下看吧!

    翻译效果对比

    我会标记出我觉得难以理解或者明显错误的部分,以及我觉得很好的部分

    原文

    The Four Hobbies, and Apparent Expertise

    Around the end of high school, I started to get really into photography. My friend (let’s call him T) was also into it, which should have been great fun. But it wasn’t. Going shooting with him was never great, for a reason I didn’t figure out till much later. I wanted to take photos. T mostly enjoyed tinkering with cameras. As I’ve spent more time on different hobbies, it’s become clear that this is a common pattern. Every hobby, pastime1, or sport, is really four hobbies.

    Google 翻译

    四种爱好明显的专长

    大约在高中结束时,我开始真正喜欢上摄影。我的朋友(暂且称他为 T)也参与其中,应该会很有趣。但事实并非如此。和他一起射击从来都不是一件好事直到很久以后我才弄清楚原因。我想拍照。T 最喜欢摆弄相机。随着我在不同的爱好上花费更多的时间,很明显这是一种常见的模式。每一种爱好、消遣1或运动,实际上都是四种爱好。

    Bing 翻译

    四个爱好明显的专长

    高中毕业后我开始真正喜欢上摄影。我的朋友(让我们叫他T)也喜欢它,这应该很有趣。但事实并非如此。和他一起拍摄从来都不是一件好事原因我直到很久以后才弄清楚。我想拍照。T最喜欢摆弄相机。随着我花更多的时间在不同的爱好上,很明显这是一种常见的模式。每个爱好,消遣1或运动,实际上都是四个爱好。

    DeepL

    四个爱好,以及明显的专长

    大约在高中毕业的时候,我开始真正喜欢上了摄影。我的朋友(我们叫他T)也喜欢这个,这本来应该是很有趣的。但事实并非如此。和他一起去拍摄从来都不是一件好事原因是我直到很久以后才想明白。我想拍照片。T主要喜欢摆弄相机。随着我在不同的爱好上花了更多的时间,我发现这是一个共同的模式每个爱好,消遣1,或运动,实际上是四个爱好。

    ChatGPT 3.5

    四种爱好表面专业知识

    快要高中毕业的时候,我开始对摄影产生了浓厚的兴趣。我的朋友(我们称他为T)也喜欢摄影,这本应该是很有趣的事情。但事实并非如此。与他一起拍照并不太好玩,这是我直到很久之后才发现的原因。我想要拍照片,而T更喜欢折腾相机。随着我在不同的爱好上花费了更多的时间,逐渐变得清晰的是,这是一个普遍存在的模式。每一个爱好、消遣或运动,实际上包含了四种不同的爱好。

    GPT4

    四大爱好和表面上的专业技能

    在高中快结束的时候,我开始对摄影产生浓厚兴趣。我的朋友(我们姑且称呼他为T)也对此感兴趣,本来这应该很有趣的。但事实并非如此。和他一起拍照从来就不是什么愉快的事情,原因直到很久之后我才明白。我想要拍照。而T主要喜欢研究相机。随着我在不同的爱好上投入了更多的时间,我发现这是一个普遍的模式。每一种爱好、消遣1或运动,实际上都包含四种爱好。

    Claude 2

    四个兴趣爱好,以及表面上的专业知识

    在高中结束的时候,我开始真正地对摄影感兴趣。我的朋友(我们称他为T)也对此感兴趣,这本应该非常有趣。但事实并非如此。和他一起拍摄从来都不太理想,原因我直到很久以后才弄明白。我想拍照。T更喜欢调整相机。随着我在不同的爱好上花更多时间,很明显这是一个常见的模式。每一项爱好、消遣或运动,实际上都是四种兴趣。

    第一种兴趣是参与活动本身——拍照、玩游戏、烹饪、运动等等。第二种兴趣是获取和学习技能——学习如何拍出好照片,精通游戏,掌握烹饪技巧,运动技能等。第三种兴趣是研究装备——评估不同相机、烹饪工具、运动设备等的优缺点。第四种兴趣是社交方面——和其他人一起拍照、玩游戏、烹饪、运动等。

    这四种兴趣在任何一项爱好中都存在,但个人更倾向于某一种或某几种。要找到真正的共同点,最好找到那些在所有四种方面都感兴趣的人。这可以避免在一开始你以为找到共同点,结果发现对方的兴趣重点实际上完全不同的情况。

    PaLM2

    使用 text-bison-001

    四个爱好,以及表面的专业知识

    在高中快毕业的时候,我开始真正地喜欢摄影。我的朋友(我们称他为 T)也喜欢,这应该很有趣。但事实并非如此。和他一起去拍照从来都不是一件有趣的事,原因是我后来才知道的。我想拍照。T 主要喜欢摆弄相机。随着我花在不同爱好上的时间越来越多,我逐渐发现这是一个普遍的模式。任何爱好、消遣、或运动,实际上都是四个爱好。

    翻译效果还不错,现在需要申请才能用。

    Vicuna

    使用 vicuna-13b

    四个爱好,以及显示的专业知识》

    在高中学术退休前,我开始很兴趣拍照我的朋友(我们称他叫T)也喜欢这个事情这应该是太棒了。但是它并不是。和他一起去拍照是不太愉快的。我想要拍照T大多地享受着维修摄像头的乐趣。随着我在不同的爱好、娱乐活动或运动中花更多的时间,这是变得明显的。每个爱好、娱乐活动或运动其实都是四个爱好的。

    ChatGLM

    ChatGLM2-6B temperature:0.2 top_p:0.95

    四爱好和明显的专业知识

    高中毕业后,我开始 really 喜欢 摄影。我的朋友(让我们称他为 T)也喜欢这个这应该很有趣。但事实并非如此。和 T 一起出去拍照从来没有让我感到开心。我想要拍照。T 主要喜欢摆弄相机。随着我在不同爱好上花费的时间越来越多已经很明显这是一个共同现象。每个爱好、消遣或运动都是一个真正的四爱。

    ChatGLM2-6B演示(免费使用) https://replicate.com/nomagick/chatglm2-6b

    Llama 2

    llama13b-v2-chat temperature:0.01 top_p:0.9

    四种兴趣和显而易见的专长

    高中晚期,我开始很感兴趣摄影。我的朋友(我称他为T)也很喜欢这件事,这应该是很好的娱乐。但并不是。和他一起拍照并不是很愉快,直到很久以后才意识到。我想拍照,T主要是喜欢尝试相机。随着我在不同的兴趣和休闲中投入更多时间,我发现这是一个常见的模式。每种兴趣、休闲或运动都是四种兴趣。

    llama13b-v2-chat演示(免费使用) https://replicate.com/a16z-infra/llama13b-v2-chat

    大语言模型翻译效果更好

    DeepL 翻译、Google 翻译、Bing 翻译的翻译质量对于我去理解作者意图都不及格,既不准确,表达方式也难以阅读。而大语言模型驱动的翻译,在语境上全面了超越了这些普通的概率驱动的翻译工具,并且可读性更好。

    根据翻译质量,我认为OpenAI 的 ChatGPT 系列和 Google 的 PaLM 的结果最好,它在中文表达和翻译出作者语气方面超越了其它的方法。

    从翻译质量来说:

    GPT4 => PaLM > GPT3.5 => Llama 2 13B >> DeepL 翻译>>Google 翻译、Bing 翻译 >> vicuna-13b

    ChatGPT 3.5 翻译,翻译质量已经足够好了,70/100分,最重要的是很多工具都介入了它,比较容易使用。

    PaLM 也很不错,设置 tempature 为 0.7 偶尔结果更好,设置为 0 (可复现)的时候也还不错。

    其他的模型有各种缺点,比如GPT4 很贵,但提升效果不那么大,80/100分。Claude 会出现生成意外内容,其他的开源的模型效果参差不齐,自己部署的成本也不低。

    评估指标Google 翻译Bing 翻译DeepLChatGPT 3.5GPT4Claude2text-bison-001Vicuna-13bChatGLM2-6Bllama13b-v2-chat
    翻译准确性不及格不及格及格优秀优秀及格优秀不及格及格及格
    翻译可读性不及格不及格不及格优秀优秀优秀优秀不及格及格及格
    翻译速度

    结论

    对于比较短的内容,我会使用ChatGPT 3.5 翻译,因为它在翻译准确性、翻译可读性上非常好 ,虽然翻译速度比较慢,但也不是不能接受。

    对于比较长的内容,我会把文档分成小块让ChatGPT 3.5 翻译😄