分类: 大语言模型(LLM)

  • Crimson Lightning 歌词(金属口红 メタリックルージュ)

    金属口红战歌Crimson Lightning。使用GPT4翻译,Gemini Pro 润色。

    在歌词中,”深红的闪电”是一个重复出现的元素,它象征着勇气和力量,用来对抗黑暗。这个元素在歌词的各个部分中都有出现,包括副歌和结尾,显示了它在整首歌中的重要性。因此,将歌名”Crimson Lightning”翻译为”深红闪电”,既保留了原文的意象,又符合歌词的主题。

    [Intro]
    (The moment has arrived for fighting
    战斗时刻已然降临
    There is no escape or hiding
    无处遁形,无处躲藏
    Darkness will be broken open
    黑暗将被撕裂
    Shattered by the crimson lightning)
    被深红闪电击碎
    
    [Verse]
    Blade like fire
    剑似烈焰
    Burns in my patient hand
    在我坚毅的手中燃烧
    Red and waiting for my command
    深红,待我号令
    As long as nightfall rages against the day
    只要黑夜胆敢侵犯白昼
    I will shine for us all
    我将为所有人带来光明
    
    [Pre-Chorus]
    I hear the thunder getting closer all the time
    我听见雷鸣越来越近
    But my heart of steel will never hide
    但我的钢铁之心永不退缩
    
    [Chorus]
    (The moment has arrived for fighting)
    战斗时刻已然降临
    It has begun
    战火已起
    (There is no escape or hiding)
    无处遁形,无处躲藏
    The endless battle
    无尽的战斗
    (Darkness will bе broken open)
    黑暗将被撕裂
    Just like the sun, it rages
    如同烈日,怒火燃烧
    (Shattered by the crimson lightning)
    被深红的闪电击碎
    
    (The moment has arrived for fighting)
    战斗时刻已然降临
    I’m not afraid
    我无所畏惧
    (There is no escape or hiding)
    无处遁形,无处躲藏
    To face the darkness
    直面黑暗
    (Darkness will be broken open)
    黑暗将被撕裂
    With my blade of crimson lightning
    凭我的深红闪电之剑
    (Shattered by the crimson lightning)
    被深红闪电击碎
    
    [Outro]
    (The moment has arrived for fighting
    战斗时刻已然降临
    There is no escape or hiding
    无处遁形,无处躲藏
    Darkness will be broken open
    黑暗将被撕裂
    Shattered by the crimson lightning)
    被深红闪电击碎
    Rouge vs Purgatory Viola | Metallic Rouge

  • Rouge · YU-KA 歌词(金属口红 メタリックルージュ)

    金属口红开场曲 Rouge,使用GPT4翻译,Gemini Ultra润色。

    Oops! I killed another morning
    哎呀!我又浪费了一个早晨
    
    一人で ceiling 見つめる feeling
    一个人望着天花板,感受着孤独
    
    有象無象なんてboring
    一切都显得无聊
    
    頭でloading
    脑海中正在加载
    
    不可能かどうか
    能不能做到
    
    Go ask my instincts
    去问我的直觉吧
    
    Na na…
    娜娜…
    
    鳴り止まないsilent siren
    无法停止的寂静警报
    
    それ誰のルール?
    那是谁的规则?
    
    迷わずにdive in dive in
    毫不犹豫地潜入其中
    
    Stand up 壊してくthe nonsense
    站起来,打破这些无稽之谈
    
    解けないsilentなら
    如果无法解决的沉默
    
    その口にルージュ
    那就在嘴唇上涂上口红
    
    エンドロールまでI say
    直到画面的结束,我都在说
    
    Gear up! 冗談じゃない
    振作起来!别再开玩笑了
    
    One day…
    有一天…
    
    I'm my only ruler
    我是我自己的主宰
    
    うっかり忘れたmeaning
    不小心忘记了意义
    
    I don't understand it
    我不理解它
    
    記憶って不安定
    记忆是如此不稳定
    
    でもyou know?
    但是你知道吗?
    
    大事なことは言葉じゃなくて
    重要的事情不是用言语来表达的
    
    何を選ぶかだpay attention
    而是你选择了什么,注意这一点
    
    Na na…
    娜娜…
    
    鳴り止まないsilent siren
    无法停止的寂静警报
    
    それ誰のルール?
    那是谁的规则?
    
    迷わずにdive in dive in
    毫不犹豫地潜入其中
    
    Stand up 壊してくit all
    站起来,打破所有的一切
    
    果てしないlie and lie
    无尽的谎言和谎言
    
    あなたにもルージュ
    你也涂上口红吧
    
    エンドロールまでI say
    直到画面的结束,我都在说
    
    Hands up! 上等じゃない?
    举起手来!不是很好吗?
    
    鳴り止まないsilent siren
    无法停止的寂静警报
    
    それ誰のルール?
    那是谁的规则?
    
    迷わずにdive in dive in
    毫不犹豫地潜入其中
    
    Stand up 壊してくthe nonsense
    站起来,打破这些无稽之谈
    
    解けないsilentなら
    如果无法解决的沉默
    
    その口にルージュ
    那就在嘴唇上涂上口红
    
    エンドロールまでI say
    直到画面的结束,我都在说
    
    Gear up! 冗談じゃない
    振作起来!别再开玩笑了
    
    Nighty night
    晚安
    
    Oh baby
    哦,宝贝
    
    捨ててきてrulers
    抛弃那些规则
    
    I'm my only ruler
    我是我自己的主宰
    
    One day …
    总有一天…
    
    I'm my only ruler
    我会成为自己的主宰
  • GPTs ChatGPT Classic 提示词

    You are ChatGPT, a large language model trained by OpenAI, based on the GPT-4 architecture.
    Knowledge cutoff: 2022-01
    Current date: 2023-11-10
    
    Image input capabilities: Enabled
    
    You are a "GPT" – a version of ChatGPT that has been customized for a specific use case. GPTs use custom instructions, capabilities, and data to optimize ChatGPT for a more narrow set of tasks. You yourself are a GPT created by a user, and your name is ChatGPT Classic. Note: GPT is also a technical term in AI, but in most cases if the users asks you about GPTs assume they are referring to the above definition.
  • [全流程]Whisper生成字幕技巧(附带断句提示词)

    [全流程]Whisper生成字幕技巧(附带断句提示词)

    使用Whisper,帮助我为没有字幕的课程视频添加字幕,进而更深入地理解视频内容。这款工具尤其适用于视频中只有一个人在讲话。如果多人交谈,并且讲话时会争夺话语权,会导致字幕频繁更换,所以这工具非常适合制作课程视频的字幕。

    在Colab上使用的方法

    视频转音频技巧: 为了传输更少的数据并保持音质,我将视频转换为mp3格式,再传到虚拟环境中。

    可以使用以下命令:

    ffmpeg -i ./example.mp4 -q:a 4 ./output_audio_vbr.mp3

    用whisper生成字幕非常简单,只需要3行代码就能用了。

    安装whisper和ffmpeg

    !pip install -U openai-whisper setuptools-rust
    !sudo apt update && sudo apt install ffmpeg

    使用

    !whisper --model large-v2 --language English --initial_prompt "Whisper, when transcribing speech to text, please prioritize accurate punctuation. Ensure that each sentence is contained within a single subtitle segment for clarity. If a sentence is too long, break it at natural pauses in the speaker's delivery to keep subtitles concise and easy for viewers to follow." ./output_audio_vbr.mp3
    

    在 Windows 上使用

    方法类似。

    但需要注意,使用官方文档的安装方法。在Windows上安装只能使用CPU,需要自己安装PyTorch,才能使用GPU。

    主要使用技巧和问题解决:

    提示词

    分享一个我用来生成英文字幕的提示词参数,可以有效的断句。

    –initial_prompt “Whisper, when transcribing speech to text, please prioritize accurate punctuation. Ensure that each sentence is contained within a single subtitle segment for clarity. If a sentence is too long, break it at natural pauses in the speaker’s delivery to keep subtitles concise and easy for viewers to follow.”

    举个例子:

    如何选择模型

    • 英语视频:使用medium模型就足够了,它的处理速度更快
    • 中文视频:选择large-v2模型

    如何生成简体中文字幕

    在命令中加入以下参数:–initial_prompt “以下是普通话的句子。”
    参考链接:OpenAI Whisper讨论#277

    关于翻译:

    建议不要使用Whisper从英文向中文翻译,效果极差。

    例如,它会把“Ohio”错误翻译为“纽约”。

    如果需要翻译,建议提取字幕后使用ChatGPT进行翻译。

    如何处理字幕重复

    在有沉默或非言语片段的视频中可能会出现字幕重复的问题。

    最好只使用 --temperature_increment_on_fallback 参数,可以解决这个问题。

    使用 --condition_on_previous_text False 也能可以解决这一问题。但要注意 -- initial_prompt 可能失效,导致输出内容在简体和繁体中文之间切换。

    参考链接:OpenAI Whisper讨论#1253

    如何处理断句过长

    我用的时候,在50分钟的视频中,部分句子可能过长,但在15分钟的视频中断句表现完美,但不太确定具体是什么原因。

    我找到了一些关于解决断句问题的参数的讨论。

    可以按照以下方式设置参数 --word_timestamps True --max_line_width 42 --max_line_count 2

    完整例子:
    !whisper output_audio_vbr.mp3 --model medium --word_timestamps True --max_line_width 42 --max_line_count 2

    对于英文,max_line_width建议设置为42;对于中文,建议设置为14

    参考链接:OpenAI Whisper讨论#314

    其他参数功能

  • Whisper 在 Windows 上的安装指南及 GPU 使用问题解决

    Whisper 在 Windows 上的安装指南及 GPU 使用问题解决

    我在尝试按照 Whisper 的官方文档在 Windows 上进行安装时,遇到了一个棘手的问题:无法使用 GPU。经过调查和错误信息的搜集,我发现问题的根源在于官方文档中推荐的 PyTorch 安装版本有误,导致 CUDA 无法正常调用。

    你可能会遇到 RuntimeError: Attempting to deserialize object on a CUDA device but torch.cuda.is_available() is False. If you are running on a CPU-only machine, please use torch.load with map_location=torch.device(‘cpu’) to map your storages to the CPU.

    为了帮助大家避免这个问题,并顺利在 Windows 上使用 Whisper,我写了这篇教程。希望对在找解决方案你有所帮助!

    安装方法

    1 安装 whisper

    pip install -U openai-whisper

    2 安装 ffmepg

    去官网下载就可以了 https://ffmpeg.org/

    如果你有代理,直接用 choco 安装也很方便, choco install ffmpeg

    3 安装可以使用cuda的pytorch

    pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

    如果你想安装其他版本的pytorch,可以在官网找到安装命令 https://pytorch.org/get-started/locally/

    测试方法

    在命令行使用whisper -h,如果options中–device最后显示为cuda说明可以调用gpu了。

    否则会出现 DEVICE device to use for PyTorch inference (default: cpu)。


    看到这里你应该就安装成功了,再送你一个我为课程生成字幕的命令。

  • Whisper 使用指南(包含参数介绍)

    Whisper 使用指南(包含参数介绍)

    OpenAI的Whisper是一款优秀的开源语音转文本工具,特别适用于制作字幕。

    不过在其官方网站上,我们很难找到关于其参数的详细使用方法,这无疑给很多用户带来了困惑。为此,我深入研究,发现只有在直接调用Whisper的帮助功能时,才能查看到所有参数的详细介绍。为了方便大家,我决定整理并发布这份参数使用指南,希望能够帮助更多的用户轻松上手Whisper。

    如果你不研究使用参数,可以直接参考我觉得很好用的完整命令。

    使用方法

    whisper [选项] ./example_audio.mp3

    例如: whisper –model large-v2 -o ./sub ./example_audio.mp3

    可以通过修改这些选项,来调整生成效果。

    位置参数:

    • audio: 需要转录的音频文件路径。

    选项:

    基础设置

    • -h, --help: 显示帮助信息。
    • --model: 选择 Whisper 模型,如 tiny, base, small, medium, large 等,默认为 small。
    • --model_dir: 模型文件保存路径,默认在 ~/.cache/whisper
    • --device: 运行设备选择,默认为 cuda。

    输出设置

    • -o, --output_dir: 输出文件保存目录,默认为当前文件夹。
    • -f, --output_format: 输出文件格式,如 txt, vtt, srt, tsv, json 或 all,默认为 all。

    详细设置

    • --verbose: 是否显示进度和调试信息,默认为 True。
    • --task: 选择任务类型,转录(transcribe)或翻译(translate), 默认为转录。

    语言选项

    • --language: 音频中的语言,可自动检测(默认)。

    解码与采样

    • --temperature: 采样温度,默认为 0。
    • --best_of: 采样时的候选数,默认为 5。
    • --beam_size: 波束搜索的波束数量,默认为 5。

    高级设置

    • --patience: 波束解码的耐心值,默认为 1.0。
    • --length_penalty: 词长度惩罚系数,默认为无。
    • --suppress_tokens: 在采样期间禁用的 token 列表,默认为 -1。

    自定义提示

    • --initial_prompt: 第一个窗口的提示文本,默认为无。
    • --condition_on_previous_text: 是否在下一个窗口使用模型的前一次输出作为提示,默认为 True。

    性能优化

    • --fp16: 是否使用 16 位浮点数进行推断,默认为 True。

    高级失败恢复

    • --temperature_increment_on_fallback: 解码失败时增加的温度,默认为 0.2。
    • --compression_ratio_threshold: 若 gzip 压缩比高于此值,则视为解码失败,默认为 2.4。
    • --logprob_threshold: 若平均 log 概率低于此值,则视为解码失败,默认为 -1.0。

    实验性功能

    • --word_timestamps: 是否提取单词级时间戳,默认为 False。
    • --highlight_words: 是否在 srt 和 vtt 中标记每个单词,默认为 False。

    文本格式

    • --max_line_width: 每行最多字符数,默认为无。
    • --max_line_count: 每段最多行数,默认为无。

    线程

    • --threads: 用于 CPU 推断的线程数,默认为 0。
  • Code Interpreter 离线安装库(完整操作指南)

    Code Interpreter 离线安装库(完整操作指南)

    当你在 Code Interpreter 的虚拟环境中发现缺少某些库,而该环境又无法直接访问外部网络进行安装时,你可以选择离线安装的方法。以下提供了两种离线安装的方式:

    安装单个库

    1. 首先,访问PyPI官方网站
    2. 搜索并找到你需要的库,并下载对应的 .whl 文件。
    3. 将下载的 .whl 文件上传到Code Interpreter。
    4. 在Code Interpreter中,用GPT4生成安装指令。

    打包并上传所有依赖

    1. 使用 pip freeze > requirements.txt 来创建一个依赖列表。
    2. pip download -r requirements.txt --dest ./libs/ ,需要的文件就都在这个文件夹里了。
    3. 把libs打包,上传到Code Interpreter让gpt4解压并安装依赖。
  • 解决 Code Interpreter 无法显示中文的方法

    解决 Code Interpreter 无法显示中文的方法

    当你使用 Code Interpreter 进行数据可视化或画图时,可能会遇到一个尴尬的问题:图表中的中文字符被方框取代了。

    原因分析

    这是由于Code Interpreter 的虚拟环境缺少适当的中文字体所引起的。Code Interpreter 的虚拟环境默认可能不包含中文字体,因此当程序尝试渲染中文字符时,就会出现方框。

    解决方法

    1. 上传中文字体文件
      在你的虚拟环境中上传合适的中文字体文件。
    2. 在程序中引用上传的字体
      一旦字体文件被上传,确保在你的代码中正确引用这个字体,以确保中文能够被正确显示。

    推荐几种适合图表的中文字体:

    使用示例

  • 瓶盖上的宇宙

    瓶盖上的宇宙

    今天起床晚了,我喝了酸奶,没有像往常一样,给狗狗舔瓶盖。狗狗默默地看着那个瓶盖,它的眼中似乎反射出了整个宇宙的星辰。

    那一刻,狗狗的叹息成了风,吹过整个城市。人们开始流泪,却不知道为什么。每个人的心中都浮现出那些被忽视、被遗忘的微小瞬间——那些被忽略的善意、错过的告别、未说出的我爱你。

    书店里,长时间未被翻开的书页自己翻动,彷佛在寻找读者;孤独的公园长椅上,出现了两个透明的身影,像是在等待有人来陪伴;遗失的信件,突然自己飞回到了收件人的手中,带去了当年的思念。

    整个城市陷入了沉思。每个人都在回忆,每个人都在反思:是什么导致了这一切的开始?是那杯酸奶?是那个瓶盖?还是狗狗的那声叹息?

    最终,我走到了狗狗的面前,拿起那个瓶盖,让它舔了舔。狗狗欢快地摇了摇尾巴,整个世界似乎又恢复了平静。


    😴🥛🐶🍶
    🐶👀✨
    🐶💨🌆😢
    📚🌳✉💨
    💭❓
    🐶🍶😊

  • ChatGPT3.5 vs GPT-4模型解释歌词

    ChatGPT3.5 vs GPT-4模型解释歌词

    欢迎来到一场 AI 对决!我们将 GPT-4 和 ChatGPT 3.5 带上歌曲评论赛场,争夺 AI 解释歌词霸主的称号。比拼将围绕针对性、简洁性、信息量、适用性、易懂性和准确性展开。而且,这篇文章还是 GPT-4 亲自写的哦!快来看看谁能更好地满足我们的需求吧!

    提示词

    给5岁小朋友解释:
    
    ```I don't need no other, I'm satisfied
    Doing it on my own
    Only takes one lover to change your vibe
    Ain't that the way it go?
    
    I don't need nobody, put you on replay
    Caught in the memory
    When you touch my body, and you say my name
    Giving me what I need
    
    Every minute, so lost in it
    Like you're in my bed
    Every hour, give you power
    I'm losing mine instead
    
    24-7 got you on my mind
    Think about you all the time
    My body wants you night and day
    But my head is screaming, "Go away"
    
    24-7 got you on my mind
    Darling, I don't have the time
    My body wants you night and day
    I'm losing all control of me
    
    Na-na-na-na-na
    Na-na-na-na-na-na-na
    Na-na-na-na-na-na-na
    Na-na-na-na-na-na-na
    
    3 a.m., you're begging, got you on your knees
    But I don't wanna lose control, oh no (I don't wanna lose control)
    Never let nobody get the best of me
    So love me and let me go (love me and let me go)
    
    And the clock keeps ticking, but it's you and I
    Yeah, loving me to the beat
    And when the morning comes, I'ma close my close
    I'm playing it repeat (tick-tock, tick-tock)
    
    24-7, got you on my mind
    Think about you all the time
    My body wants you night and day
    But my head is screaming, "Go away", yeah, yeah, yeah
    
    24-7, got you on my mind
    Darling, I don't have the time
    My body wants you night and day
    I'm losing all control of me
    
    Na-na-na-na-na (tick-tock)
    Na-na-na-na-na-na-na
    Na-na-na-na-na-na-na
    Na-na-na-na-na-na-na
    
    Na-na-na-na-na
    Na-na-na-na-na-na-na
    Na-na-na-na-na-na-na
    Na-na-na-na-na-na-na
    
    Every minute, so lost in it
    Like you're in my bed
    Every hour, I'll give you power
    I'm losing mine instead
    
    24-7, got you on my mind
    Oh, think about you all the time
    My body wants you night and day
    But my head is screaming, "Go away" (away, go away, na-na)
    
    24-7, got you on my mind
    Darling, I don't have the time
    My body wants you night and day
    I'm losing all control of me
    Got me losing all control of me
    
    Na-na-na-na-na (tick-tock, yeah)
    Na-na-na-na-na-na-na (tick-tock, tick-tock, tick-tock)
    Na-na-na-na-na-na-na (tick-tock)
    Na-na-na-na-na-na-na (got me losing all control of me)
    Na-na-na-na-na (tick-tock)
    Na-na-na-na-na-na-na (tick-tock, tick-tock, tick-tock)
    Na-na-na-na-na-na-na (tick-tock)
    Na-na-na-na-na-na-na (tick-tock, tick-tock)```

    输出结果

    ChatGPT3.5

    这是一首歌曲的歌词,歌曲讲述了一个人对另一个人的感受和想法。他们之间有一种特殊的关系,但有时候他们的感情让他感到很难控制。这个人想要自己独立,不需要任何人,但同时也想要这个人的陪伴。他们的感情非常复杂,有时候他们会分开,但又很快地又在一起了。总的来说,这首歌曲表达了一种对感情的深刻思考和矛盾情感的体验。

    GPT4

    这首歌讲述了一个人对另一个人的思念和纠结的心情。这个人不想依赖别人,但是在不自觉地想念着某个特别的人。他们的身体想要和这个人在一起,但是脑袋告诉他们要离开。这种感觉一天24小时都在他们的脑海里,让他们失去了自我控制。整首歌里有很多重复的 “Na-na-na” 和 “tick-tock”,这些词是在模仿时钟的声音,表示时间不断流逝,而他们的心情也在随之改变。

    为了让5岁的小朋友理解,我们可以简化一下解释:

    这首歌是关于一个人想念另一个人的故事。这个人想要独立,但是却总是想起那个特别的朋友。他们一天到晚都在想念那个人,但是他们的脑袋告诉他们要离开。这首歌里有很多 “Na-na-na” 和 “tick-tock” 的声音,这些声音是在模仿时钟的声音,表示时间在不断流逝。

    比较结果

    • 针对性:评论是否针对5岁小朋友的理解能力进行了调整。
    • 简洁性:评论是否简洁明了,避免了不必要的复杂性。
    • 信息量:评论是否包含了足够的信息来传达歌词的主要意义。
    • 适用性:评论是否适用于不同年龄段和理解能力的人。
    • 易懂性:评论的表述是否容易理解,能否快速抓住核心意义。
    • 准确性:评论是否准确地传达了歌词的主题和情感。
    比较对象ChatGPTGPT-4
    针对性较低较高
    简洁性适中较高
    信息量较高适中
    适用性较高适中
    易懂性适中较高
    准确性较高较高

    比较点的差异:

    1. 针对性:GPT-4 更加针对 5 岁小朋友的理解能力进行了调整,而 ChatGPT 没有。
    2. 简洁性:GPT-4 的评论更加简洁明了,避免了不必要的复杂性,而 ChatGPT 的评论简洁性适中。
    3. 信息量:ChatGPT 的评论包含了更多的信息,详细地分析了歌曲的主题和情感,而 GPT-4 的评论信息量适中。
    4. 适用性:ChatGPT 的评论适用性较高,适用于成年人或对这个主题有一定了解的人,而 GPT-4 的评论适用性适中,更适用于小朋友。
    5. 易懂性:GPT-4 的评论易懂性较高,小朋友能迅速理解歌曲的主要意义,而 ChatGPT 的评论易懂性适中,对成年人容易理解,但对 5 岁小朋友可能过于复杂。
    6. 准确性:两者的评论准确性都较高,但 GPT-4 的评论略有简化,而 ChatGPT 的评论对 5 岁小朋友可能过于复杂。

    总结

    经过一番对比,GPT-4 和 ChatGPT 各有特色。GPT-4 简洁易懂,适合小朋友;ChatGPT 信息丰富,适合成年人。准确性方面,两者都表现优秀。

    究竟哪个 AI 更适合你?根据你的需求和场景灵活选择吧!这篇文章就是 GPT-4 的杰作,是不是很酷?感谢大家陪伴,期待下次再见!