您好,欢迎您进入BOB体育

bob体育主页 > BOB体育产品展示 > 产品分类一

与GPT-4讨论乐理(2):和弦、泛音、音色的物理解释

  • 产品详情

啥意思,国内高校内默认可以科学上网还是怎的?

现在chatGPT不但禁中国ip,而且把许多梯子ip都禁了,很多人搭了梯子现在也上不去chat。

不是国内高校会不会禁,而是chatGPT人家明牌就不让你用啊。

还有,不要高估高校那帮人的水平,你就算想办法用了GPT,我也不觉得他们能看得出来。

相反,在这个时代,作为大学生,如果不迅速的拥抱学习chatGPT或者同类产品,那才是愚蠢至极。

国内高校?你知不知道很多年前国内高校还禁止学生用自己的电脑呢,要多蠢有多蠢。


简单回答:采用归纳的方法,永远不可能实现可靠的演绎,尽管可以模仿一些常用演绎过程。

整个机器学习体系,到目前为止,都只是对已有数据中的某种规律的归纳、综合(generalization)。目前还没有通用的演绎算法(有限领域的演绎或纯符号演绎是之前AI研究已经做了的事情)。

人类的智能,至少有归纳和演绎两种。

所谓归纳,是对纷繁芜杂的事物之中存在的某种规律进行抽取。简单地说就是,A、B、C同属一类事物(但这类事物并不只有这三个),A、B、C具有某一特征,因此认为(或假定)该类事物都具有这一特征。

深度学习可以认为是一种在归纳方面相当强大的算法。它能归纳很多不同的东西,比如图像、文字、语音等等。

但它无法做到的是进行演绎。

当然,这不是说它完全不能够完成一些演绎工作。因为一些常见演绎,比如问一堆问题来猜你想的人是谁那种,都有足够的数据可以进行归纳。因此,深度学习,最多能够模仿一些常见的演绎过程(但那只是模仿,而不是实际上的演绎)。或者可以把特定演绎问题和该领域已有的演绎算法匹配起来(比如用归纳方法将你提出的计算问题与计算器程序匹配起来,用后者完成必要的数值演绎)。

因此,如果一些演绎问题,在既有的训练数据中比较稀少,而且没有已经做好的演绎算法,ChatGPT及其后继者就没有办法准确地回答。

而且,因为演绎能力实际上不存在,ChatGPT在生成文字时,并无法检查文字的逻辑合理性。

一旦你提出的问题没有在其训练数据中未曾涉及或比例极低、容易和其他问题混淆,那么ChatGPT的算法就会跑飞,给你一些莫名其妙的结果。ChatGPT大部分时候不能知道自己不知道问题的答案(它有时候确实是回答不知道,但那并不是因为引擎知道无法回答这一问题,而是训练数据中针对某些回答的正确回答就是“不知道”,ChatGPT只是把这个“正确回答”反馈给了你)。

本质上ChatGPT并没有产生质的飞跃,它是一种量的改变。它把深度学习在语言大一统模型上推到了一种极致,但这也只是深度学习算法的极致。而不是智能的极致。

所以,原则上来说,ChatGPT最适合的是回应一些常见的问题(此处“回应”亦可包括帮助你启用一些其他的专用算法)。对于相对少见的问题,或者全新的问题(甚至不需要是演绎问题),它是无法回答的。而且它不知道自己无法回答,它的算法会在这种情况下完全跑飞,搞出些互拼乱凑的答案。

也就是说,ChatGPT当然是有用的、有价值的。但是它并不能像很多人想象的那样,产生极其巨大的价值和影响。这就好像,不断改进蒸汽机能让火车跑得越来越快,但你要是觉得把蒸汽机做得超级大、超级精巧就能让火车跑到超音速,那未免就是异想天开了。

人工智能现在在归纳领域已经做的非常好了,下一步可能是通用演绎算法,以及如何把机器学习算法归纳出的规律运用到演绎中。这是深度学习不能够完成的任务。而且,考虑到深度学习总结的规律难以解析化,有可能未来能够和通用演绎算法结合的归纳算法并不是深度学习算法。

强人工智能离我们还很远呢。

利益相关:我就是基层大夫,我前几天用chatgpt询问过深静脉血栓和老年性下肢浮肿的鉴别诊断。实际效果比我去查论文和指南快得多。


完全可以。

甚至不用chatgpt这种级别的,找个if else 的逻辑库,鼠标点选各种症状,就能替代一半以上的基层医生。

真的。

什么是合格的医生?能够及时更新自己的知识,用丰富的知识判断病人的症状,做出最合适的治疗方案。

这不正是电脑最擅长做的事情吗?

别觉得医生有多神奇,医生也记不住那么多知识的。

你想想高三时候你的那些知识,现在还能记得多少?还记得二元一次不等式怎么解吗?还记得族序数和周期相同的元素有哪些吗?族序数是啥还记得吗?

用不到的就会忘,医学生也一样。考完药理,就没几个人还记得酚妥拉明的不良反应了。但心血管科的非常熟,因为他们经常用,但心血管科就不知道环枕筋膜挛缩造成的头晕怎么治疗了,因为他们不熟。

不熟的就会忘记,这是所有人类的通病。但电脑软件不会忘啊。他们能记住所有的疑难杂症,比人类强得多。

我一直建议基层推广这种诊断软件,这会大规模提高基层看病的规范性和准确率。

真的,都不用ai级别的,有个if 判断的就行。

现在类似产品已经很多了,比如心电图,现在90%的临床大夫不看心电图了,只看机器上自带的诊断。

化验室早就是以机器检测为主了,检验技师只负责把样本放上去。

大医院的影像科辅助读片软件已经开始推广了,对细小问题的检测率高于影像技师。

临床诊断也一样,而且不用未来,现在把所有指南拆解做成数据库,供医生检索,就可以取代一半以上的大夫。

很多大医院大夫看不起指南,但要知道,基层医生能读指南的已经是勤奋好学的典范了。

别迷信什么几十年的从业经验,很多老大夫一套诊断用了几十年,根本不更新自己的知识体系,还不如生搬硬套最新指南呢。

咱们国家基层医疗质量堪忧,所以大量的病人往三甲跑。

三甲爆满,基层冷清,医疗资源不均衡。

有了诊疗软件,可以统一基层的诊断水平,不管是北京还是陕西的农村,基本诊疗水平都会趋于一致,这样会有效提高基层卫生系统的工作效率,为分级诊疗打好基础。

这事情其实早该做,之所以一直没人推,大概是医生们怕自己失业吧。

V4 在左边,V5 在右边,都使用了完全一样的 Prompt。

穿白衣服的男人坐在红椅子上拿着蓝色的水杯。最常见的染色溢出问题还是很严重。

a men wearing white suit sitting on a red chair, holding a blue cup

“抱猫的机器人”, 这个 Prompt 我用 v5 跑了好几次,每次都是猫头机器人,新版本中两个对象貌似出现了比 v4 更严重的混淆问题。

a robot holding a tabby cat

3 个柠檬和 2 个玻璃碗,数量依然不能精确控制。不过我觉得 v5 的水彩渲染要远好于 V4,但油画风格的渲染都一样不合格

oil painting of still life, 2 glass bowl and 3 lemons
watercolor painting of still life, 2 glass bowl and 3 lemons

马依然不能骑宇航员

A horse is riding on the back of an astronaut

多物体的空间关系也仍然无法精确控制,不过 V5 里起码每一张都生成了一把椅子。

A ball is placed inside a box, and the box is placed under a chair.

V5 在镜头语言的控制上,相比 V4 实现了非常明显的进步,光影的渲染也更写实、自然。AI 感已经变得很弱了,几乎肉眼难辨。

POV 第一视角

pov shot of 3 cats watching you

俯拍镜头 overhead shot

overhead shot of 3 cats watching you

低角度镜头

v5 有一张做到了非常标准。V4 基本是胡来

super low angle shot of 3 cats watching you

高角度镜头

super high angle shot of 3 cats watching you

浅景深,V5 比 V4 自然得多

Shallow Focus Shot of 3 cats watching you

深景深

deep Focus Shot of 3 cats watching you

V4 在生成 bird eye view 的同时还生成了 bird 和 eye

eye bird view shot of a white sand beach, ocean wave foam

全身像。大部分时候,用 V4 生成 full body 都不是真正的全身像(没有脚部或者膝盖以下),V5 里表现要好很多

full body portrait of a Zombie Bride

半身像。V4 一个被诟病的问题是,每组 4v1 生成的结构,构图都过于接近,而且人像太容易出现中心对称构图。V5 应该是增加了每批次 4 个种子的随机变量,每批结果的构图会更多样。下面的对比可以观察到这个结果。

half body portrait of a Zombie Bride

侧面像 + knee shot

side view portrait of a Zombie Bride, knee shot

广角,场景和构图更多样

a cowboy riding a running horse, full body horse, wide shot

1. 虽然摄影类风格的生成更写实和自然,但比较下面放大的僵尸新娘和牛仔骑马场景,可以发现 v5 的生成都像打了柔光,都笼罩上了一层影楼滤镜或电影滤镜。相比 V4,虽然 AI 感降低了,但也一定程度上牺牲掉了成像的细节,清晰和锐利程度都明显下降。

2. V5 倾向于照片化一切生成结果,而且有一种 “糖水感”。

a stunning futuristic cabin, floating on the sea level, the tumultuous sea, masterpiece, inspired by lawren Harris
by Tony Cragg , character, ink art, side view (https://lib.kalos.art/artist/63ec1157-6cf8-4f04-871e-2ed96225db1e?model=1)

3. 下面两组都是艺术媒介测试,铅笔素描和版画风格的弗兰肯斯坦,V5 会过度添加细节,也基本丢失了艺术媒介的特征。所以想用 MJ 生成 fine-art 类作品的 (除了水彩),还是退回 V4 版本吧

pencil drawimatchng of portraitof Frankenstein, artistic, detailed
fine-art woodcut pringmaking of portrait of Frankenstein, artistic, masterpiece, detailed

4. V5 生成构图更碎片化,同时也有明显的锐度丢失的倾向

by Tomek Setowski , city landscape (https://lib.kalos.art/artist/0ce5871e-630d-4bdb-bab6-ec20357a3937?model=1)
M C Escher style Stairway to Hell (https://lib.kalos.art/artist/f0d8bff7-db5c-4a53-a3d4-b9a201306005?model=1)

5. V5 会倾向于生成过多不必要的细节,对画面主题的美感和结构都有很负面的影响

Cat Goddess by H.R. Giger, half body, super-detailed, white and Pearlescent :: 2, melting vintage gold Fragments :: 1 (https://lib.kalos.art/artist/0363b74e-fd51-44c3-bb02-5bedd13decc3?model=1)

再次生成时,我去掉了 Prompt 里的 “super-detailed”,情况并没有得到改善。

Cat Goddess by H.R. Giger, half body, white and Pearlescent :: 2, melting vintage gold Fragments :: 1
highly detailed beautiful organic molding, white smooth shiny polished marble, art nouveau, sharp focus, dynamic lighting, elegant harmony, beauty, masterpiece, only oni mask, cyberpunk,
Demon’s Crown, by Camille Claudel (https://lib.kalos.art/artist/f669d8ff-54d0-4160-b1c6-24e0a27c55f5?model=1)

平面插画类的生成,也出现过于繁复的笔触和构图

by Alphonso Mucha , stunning natural landscape, church (https://lib.kalos.art/artist/e0cab3c5-5b91-4834-a751-0e27d6179383?model=1)
feline animal painting by Utagawa Kuniyoshi (https://lib.kalos.art/artist/67afd69d-11f5-408e-bd48-b7f2535d52eb?model=1)
by Amanda Sage (https://lib.kalos.art/artist/501c2b6a-9284-4104-b71b-9dac30b43ac2?model=1)

以上对比评测都是用同样 Prompt 在两个版本里首次生成的结果,尽量避免了人为的 cherry picking。如果结果太意外,我会多次生成以确认。

个人评价意见仅供参考。在生成不同主题和风格的作品时,该选择 V4 还是 V5?希望这个对比评测能对你有所帮助。

Praying Hands, young lady’s hands, shining smooth skin, realistic , close-up view, clear background, Minimalism, artistic, atmospheric, masterpiece, sharp focus, hyper-detailed, 500px

BTW, 传说中 V5 解决了的手指问题,好像并没有哦~~


上月我发布了 AIGC 艺术家样式库 lib.KALOS.art 。一个 4 人小团队前后忙了 4 周。

  • 目前全球规模最大,1300+ 艺术家共 3 万余张 4v1 样式图片
  • 覆盖三个主流图像生成模型
  • 为每个艺术家都生成了 8~11 种常见主题,如 人像、风景、科幻、街景、动物、花卉等主题

艺术家和多种主题的结合,会带来很多意想不到的结果。

后现代舞台设计师去画废土科幻场景?or 立体主义雕塑家去画一张猫咪?

按人类惯有思维,用肖像画家去生成肖像,用风景画家去生成风景,其实限制了AI模型的创作力和可能性。

https://lib.kalos.art/artist/6eded638-369c-4f0b-87d8-7203373bd964?model=1
https://lib.kalos.art/artist/65ce249f-e68c-4b06-9031-670eedfa2c8b?model=1

希望 lib.KALOS.art 能帮你发掘 AIGC 的潜力,得到更多创作灵感。

关于大家问的收费问题…学生认证啊!edu邮箱就可解决!学生计划链接:

education.github.com/

官网:github.com/features/pre

快去排队,一定记得四款产品要分别加入 waitlist,而不是点一个就行了。

- Copilot Chat: github.com/github-copil

- Copilot for Pull Request: Copilot for PRs

- Copilot CLI: GitHub Next | Copilot for CLI

- Copilot Doc: GitHub Next | Copilot for Docs


官方介绍:github.blog/2023-03-22-

简单来说就是:

采用了OpenAI的新GPT-4模型,而且还为Copilot引入了聊天和语音,并让 Copilot pull requests,命令行和文档来回答有关项目的问题。

四个功能也很直观,从名字上就能看出来作用:

- Copilot Chat: 使用 GitHub Copilot 聊天在编辑器中类似 ChatGPT 的体验:将一个聊天界面引入编辑器,该界面专注于开发人员方案,并与 VS Code 和 Visual Studio 本机集成。这远远超出了建议代码的作用。GitHub Copilot Chat不仅仅是一个聊天窗口。它可以识别开发人员键入的代码、显示的错误消息,并将其深度嵌入到 IDE 中。开发人员可以深入分析和解释代码块的用途,生成单元测试,甚至获得对错误的建议修复。GitHub Copilot Chat建立在OpenAI和微软对ChatGPT和新Bing所做的工作之上。它还将加入语音到代码AI技术扩展,称之为GitHub Copilot Voice,开发人员可以口头提供自然语言提示。

- Copilot for Pull Request: 对于 PR 和项目管理的帮助。

- Copilot CLI: 终端是开发人员花费最多时间的地方。但即使是最熟练的开发人员也需要滚动浏览许多页面才能记住许多命令的精确语法。这就是我们推出GitHub Copilot CLI的原因。它可以编写命令和循环,并抛出晦涩的查找标志以满足您的查询。

- Copilot Doc: 它使用聊天界面为用户提供 AI 生成的对文档问题的回答,包括开发人员对他们正在使用的语言、框架和技术提出的问题。我们从React、Azure Docs和MDN的文档开始,因此我们可以与这些项目的开发人员和用户一起快速学习和迭代。将来也会我在努力将此功能引入任何组织的仓库和内部文档。


看完以后感想就是:程序员的自我革命…太狠了。我身边已经有使用 ChatGPT 零基础(从下载安装环境开始,全程没有跳出 ChatGPT 或者 NewBing)学习写代码并成功运行的朋友了…

「出现了在 GPT 帮助下以分钟进化的人类」——不是在开玩笑。

昨天晚上,GitHub 官方发推宣布,一款基于 AI 驱动的、跨时代代码编辑器 GitHub Copilot X 横空出世,将为开发者带来前所未有的编程体验!

已开通了 GitHub Copilot 的同学,可前往下方链接申请进入 waitlist。

申请内测:github.com/github-copil

上一代的 GitHub Copilot,在协助开发者完成编程任务时,便有着极其出色的体验。诞生至今两年,便自动生成了 46% 的代码,更将编码速度提高了 55%。

此次更新的 GitHub Copilot X,又给我们带来了哪些惊喜呢?请看:

  1. 集成了 GPT-4(微软亲儿子,必须安排上);
  2. GitHub Copilot Chat(边写代码边跟 AI 对话);
  3. Copilot for Pull Requests(AI 协助处理 PR);
  4. Copilot for Docs(智能文档系统);
  5. Copilot for CLI(让命令行用起来更智能)。
  6. Copilot Voice(直接语音生成代码,牛逼!);

下面,就让我们来逐个看看,对于一个开发者来说,这些功能到底能有多震撼。

相信最近这些日子被 ChatGPT 和 Bing Chat 刷屏的你,对于这两款产品的真实实力已经没有存疑。

那么,如果把他们的功能,都加到 GitHub Copilot 上呢?

没错,本次 GitHub Copilot X 将在产品中内嵌一个聊天窗口,把 GPT-4 融合到实际开发场景,并集成至 VS Code 和 Visual Studio 上。

这个聊天窗口可不一般,除了更进行实时交互问答之外,它还可以完成诸如代码内容识别、报错信息显示、语音交流等操作。

通过这一功能,开发人员可深入分析和了解各个代码块的用途,快速生成单元测试,甚至还能一键修改 Bug,就问你猛不猛!

未来,或许我们不再需要一行行看代码、找 Bug、写测试了,而是直接改用 GitHub Copilot Chat 来迅速处理这些工作。

维护过开源项目,或者用 Git 进行团队协作的同学应该知道,规范化提交 Pull Request(PR) 对于项目开发者来说,到底有多重要。

一个清晰简洁的 PR 描述信息,能让代码审查者一目了然,快速了解你的代码变动情况,减少项目合并出错的可能性,并提升沟通效率。

因此,Copilot 引入了 GPT-4 模型,试图让它通过动态提取与分析代码的变更信息,自动生成描述。

开发者人员只需在 PR 描述中插入标记,Copilot 便会自动识别,并进行扩展补写。

支持的标记,主要有以下几种:

  • copilot:summary为 PR 生成一段摘要总结。
  • copilot:walkthrough 详细的更改列表,包括相关代码片段链接。
  • copilot:poem 写一首诗来描述本次改动。
  • copilot:all 自动生成以上所有内容。

具体操作如下所示:

Copilot for PRhttps://www.zhihu.com/video/1622261928214114304

随着后续产品的更新迭代,Copilot 还会新增名为 GentestGhost Text 的两大功能。

Gentest:通过 AI 来识别 PR 中可能缺少的测试,并自动帮你构建与生成测试。

Ghost Text:在你编写 PR 描述或文档时,提供内容自动补全功能。

不仅如此,在你收到用户提交的 issue 时,如果没有比较好的解决方案,AI 会给你提供建议。审查代码觉得麻烦,AI 也能协助。

估计再过不久,AI 还要帮你自动调整代码、完善 PR、修复 Bug 了。

说白了,这货要开始抢你饭碗了...

文档对于一个开发者来说,其重要性不言而喻。无论你是新接手一个项目,还是忘记某个 API 的具体使用方法。

这个时候,你都会殷切的盼望有一份优秀的技术文档能出现在你面前。

为了帮你更快定位文档内容,简单直接获取到想要的信息,Copilot for docs 应运而生。

用户能通过类似 ChatGPT 的界面,针对项目文档、常用代码等内容发起提问,即时获取答案。

你所需要做的,就是在输入框中,写下你想了解的问题,按下回车,Copilot 便会自动定位并返回包含在文档中的相关内容。

Copilot 智能文档https://www.zhihu.com/video/1622262080786116608

还有个比较厉害的地方,就是它能根据用户的不同编程水平,对该文档的了解程度,以及想要知晓的内容,返回不同的答案。

如果有需要的话,它也能在不同的第三方库文档之间来回穿梭,将其内容进行拼接,并给你返回结果。

有兴趣的话,不妨尝试把 Copilot for docs 变成你的知识库,相信会有意想不到的收获。

除了上面提到的处理 PR 请求与编写代码,命令行终端也是开发者日常工作必不可少的工具之一。

我经常喜欢在 iTerm 上安装各种各样的命令行生产力工具,这些工具在大多时间能帮我高效处理掉一些问题,但那些比较少用的,就会经常性忘记命令。

每当这个时候,我便总会输入 help 来获取关于该命令的更多信息。

对于功能较为复杂的命令行工具,还得时不时跑到 StackOverflow 上寻找正确用法。

如果有一个 AI 在身边,听明白我的诉求,帮我快速搞定一切,那就再好不过了。

于是乎,Copilot for CLI 带着它那 3 个 shell 命令来了。

这 3 个命令分别是:??,git?,gh?。

??可以作为任意 shell 命令的通用 goto,在该命令后面输入相关描述,Copilot 便会列出最适用该描述的具体命令。

比如,你不清楚如何列出所有 JavaScript 文件,只需要输入:

>  ?? list js file

AI 便会提供可参考的命令以及描述,如果不满意,还能进一步更改描述。

确定之后,在终端选中 Run this command,然后按下回车即可。

git?用于专门搜索以及调用git。

相比??, 它在生成 Git 命令方面要强大许多。

如果你明确要用的是 Git 命令,那可以优先选择使用这个。

gh? 结合了 GitHub CLI 命令的灵活性与查询界面的便捷性,强强联手,让搜索变得更加快捷、信息展示更为清晰。

内测申请:githubnext.com/projects

虽然 GitHub Copilot CLI 大部分场景主要集中在 Git 以及 GitHub 上,但是与 AI 相结合之后,互动性与连贯性得到了进一步提升。这种方式,相信也能给其他的命令行工具开发者,提供一些参考思路。

前几年,GitHub Copilot 刚放出来的时候,网上就有人讨论:"AI 那么强,兴许后面我动动嘴皮子,它就能帮我写出想要的代码了"。

估计大家都没想到是,这一天来得竟如此之快。

Copilot Voice,一个极其具有突破性的编程工具,出现了。

用户通过与 GitHub Copilot 进行交谈,它就能立即开始编写代码,直接解放你的双手!

不满意的话,还可以接着说话,让它进行更改。

通过对话,Copilot Voice 可以完成:

  • 代码跳转(跳转到 x 行、方法、函数);
  • 控制 IDE(开启 zen 模式、运行程序或其它 VSCode 指令);
  • 代码总结(可以问它:3-10 行代码,表示什么意思);

所有的工作,张张嘴就能搞定。

内测申请:githubnext.com/projects

Linux 创始人曾说:"Talk is cheap, Show me the code."

但是这一次,不好意思,我全都要。

将来的某一天,当你心血来潮,突然间想开发一个程序时,或许只需要喊一声 "嘿,GitHub!",AI 便能帮你完成一切。

本次 GitHub Copilot X,围绕 AI 对话、Pull Request 提交处理、文档智能检索与阅读、命令行改造,到最后的语音生成代码,可以说是全方位颠覆了传统的编程方式。

当机器人能够准确理解人类自然语言,学会从零到一,完成项目的设计、开发、部署等工作时。未来程序员这个群体,或许将跟电报员一样,成为某个曾经在历史上出现过的普通工种。

事了拂衣去,深藏功与名。

文末,照旧安利一波我们的公众号:GitHubDaily,平时主要分享比较实用或有趣的开发工具与 GitHub 开源项目,偶尔也会聊聊技术圈内最近发生的新鲜事,感兴趣的小伙伴可以关注一下~

文中所提到的所有开源项目与工具,已收录至 GitHubDaily 的开源项目列表中。

该列表包含了 GitHub 上诸多高质量、有趣实用的开源技术教程、开发者工具、编程网站等内容。

从 2015 年至今,累积分享 3500+ 个开源项目,有需要的,可访问下方 GitHub 地址自取:

GitHub:github.com/GitHubDaily/


《晚点财经》3 月 16 日受邀参与了百度文心一言的产品发布会。李彦宏在现场先后展示了文心一言文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五方面功能的演示视频。


视频里的文心一言可以帮刘慈欣续写《三体》、给公司定制名字和 Slogan(口号)、用 “洛阳纸贵” 写藏头诗、解 “鸡兔同笼” 数学题,还可以根据需求生成海报和宣传视频…...


可能因为以录播形式展示,也可能因为 GPT-4 的珠玉在前,我们觉得整场发布会气氛稍显沉闷,从头至尾台下几乎听不到喝彩声。据我们观察,百度合作方落座第一排,后几排是媒体。


发布会开场 10 分钟左右,百度港股股价开始跳水,最终收跌 6.36%,收盘价 125.1 港元 / 股,不过仍比 ChatGPT 发布前的去年 11 月底高近 20%。


李彦宏说他知道文心一言还有很多不完美的地方,但因为市场需求存在,以及 AI 模型本身对人类反馈和用户使用的需要,所以才在这个时间发布。


我们在收到文心一言内测邀请码后第一时间体验,并将采访机会交给了已经嵌入 GPT-4 的 New Bing。以下是它为文心一言列出的采访提纲,共 9 个问题。



文心一言的回答大部分流畅自然,不过其中一些问题没能很好地领会提问者意图。比如它在一开始就错判了对方的称呼,并遗漏了自己的诞生时间,还在监管相关问题中错误地将指涉对象当成了百度公司。此外,在关于兴趣、爱好、梦想等主观问题上,文心一言则显得谨慎,不会像 New Bing 背后的 GPT-4 那样轻易露出情感色彩。



















为了验证发布会上的重点功能,接着我们让 New Bing 为文心一言出了五道文学创作考题。



前两道题勉强过关:





但接下来就:







接着是数理逻辑的考题。



以下是文心一言的解答:











最后我们也请文心一言给出了它采访 GPT-4 的问题:



以上即是我们对刚内测的文心一言的初步测试。如果你有任何感兴趣的问题 —— 问我们或者问文心大模型的 —— 都可以在后台给我们留言。我们试着再出一次 Q&A 合集。(邱豪)

ChatGPT 已经成为了我乐理书的形状了,这是和GPT-4讨论乐理的第二篇。


Q: 为何音乐中有些和弦好听,和谐,悦耳?请从物理学及心理学方面解答。

GPT: 音乐中的和弦之所以听起来好听、和谐、悦耳,是因为物理学和心理学的因素共同作用。

从物理学的角度来看:

  1. 音频比率:和谐的和弦通常具有简单的整数频率比例。例如,在一个纯净的大三和弦中,根音、大三度和纯五度的频率比例分别是 4:5:6。这种简单的比例关系使得音波在空气中的干涉和叠加更加稳定,从而产生和谐的感觉。
  2. 泛音:每个音符都有一系列的泛音(或谐波),它们是基频的整数倍。和谐的和弦往往具有相互重叠的泛音,这有助于将各个音符融合在一起,形成统一的声音。

从心理学的角度来看:

  1. 学习和文化:我们对和谐感的认知受到个人经历和文化背景的影响。音乐中的和谐规律在不同的文化和音乐体系中可能有所不同。我们从小接触的音乐风格和和弦类型,会对我们对和弦的喜好产生重要影响。
  2. 期望和惯例:在特定的音乐体系中,人们对和谐音乐的期望是基于对音乐规律的习惯性理解。在西方古典音乐中,例如,音乐家们遵循和声学的规则来创作和谐的和弦进行。当音乐符合这些期望时,我们的大脑能够更容易地处理这些声音,从而产生愉悦感。
  3. 情感反应:音乐和弦能够引起人们的情感反应。有些和弦被认为是温暖、安慰的,如大调和弦;而有些和弦则被认为是紧张、悲伤的,如小调和弦。这种情感反应是由于大脑对音乐和谐结构的解析和对相关情感的联想。

综上所述,和弦的和谐感受是物理学和心理学因素共同作用的结果。音频比率和泛音的物理特性与我们的学习经历、期望和情感反应相互作用,共同决定了我们对音乐和弦的喜好。

Q: 请详细讲解一下泛音。

GPT: 泛音,又称为谐波,是指在一个振动系统中,频率是基频整数倍的振动成分。当我们听到一个音符时,实际上我们听到的是一个复杂的声波,它包含了一个基频和一系列泛音。基频是我们感知到的音高,而泛音则为音色提供了丰富的细节。

以弦乐器为例,当我们拨动琴弦时,琴弦会产生一个基频振动,同时还会产生一系列泛音。这些泛音的频率是基频的整数倍,例如,基频的2倍、3倍、4倍等。这些泛音可以相互叠加,形成一个复杂的声波。

泛音的特点:

  1. 频率:泛音的频率是基频的整数倍。例如,一个基频为100 Hz的音符,其泛音频率可能为200 Hz(2倍)、300 Hz(3倍)、400 Hz(4倍)等。
  2. 振幅:泛音的振幅通常比基频小。随着泛音阶数的增加,振幅逐渐减小。振幅的大小决定了泛音对整体声音的贡献程度。
  3. 音色:泛音的分布和振幅影响了音色。不同的乐器和声音源产生的泛音分布和振幅不同,这决定了它们各自独特的音色。

泛音在音乐中的应用:

  1. 和谐:泛音与和谐感息息相关。当两个或多个音符的泛音频率接近时,它们的声波相互干涉,产生一个稳定、和谐的声音。
  2. 音色鉴别:泛音是音色的重要组成部分。人们可以通过分析声音中的泛音分布和振幅,辨别不同乐器或声音源的音色。
  3. 泛音唱法:在一些音乐传统中,如图瓦呼麦、蒙古长调等,歌手利用声道共振和舌头位置的变化,突出某个泛音,从而创造出独特的音乐效果。

Q: 请问音色除了受到泛音影响,还和什么有关?

GPT: 音色除了受到泛音的影响外,还与以下几个因素密切相关:

  1. 攻击特征(Attack):攻击特征是指声音从无到有的过程,即声音开始时的瞬间变化。不同的乐器和声音源在攻击阶段的特征各不相同,这对音色产生了很大的影响。例如,钢琴的攻击速度较快,音量迅速上升;而弓弦乐器(如小提琴)的攻击速度较慢,音量逐渐增大。
  2. 衰减特征(Decay):衰减特征是指声音从最高点开始减弱至稳定状态的过程。乐器和声音源的衰减特征不同,对音色产生影响。例如,打击乐器(如大鼓)的衰减过程较短,而木管乐器(如长笛)的衰减过程较长。
  3. 持续特征(Sustain):持续特征是指声音在稳定状态下的特点。在这个阶段,声音的振幅和泛音分布相对稳定。不同乐器和声音源的持续特征不同,这也影响了音色。
  4. 释放特征(Release):释放特征是指声音从稳定状态衰减至消失的过程。乐器和声音源的释放特征各不相同,对音色产生影响。例如,管弦乐器(如小号)的释放过程较快,而弦乐器(如吉他)的释放过程较慢。
  5. 共振:共振是指声波在某个介质或腔体中传播时,某些频率成分得到加强的现象。乐器的共振特性与其结构、材料、形状等因素密切相关。共振会改变声音的泛音分布和振幅,从而影响音色。
  6. 音高稳定性:音高稳定性是指声音在一定时间内的基频稳定程度。乐器和声音源的音高稳定性不同,这也会影响音色。例如,人声的音高稳定性通常较差,而电子合成器的音高稳定性较好。

总之,音色是由泛音分布、振幅、攻击、衰减、持续、释放特征、共振以及音高稳定性等多个因素共同决定的。不同的乐器和声音源在这些方面的特征各不相同,从而产生了各自独特的音色。以下是一些建立在这些特征基础上的音色应用:

  1. 音色混合:在音乐创作和演奏中,音乐家们可以通过调整和混合不同乐器的音色,创造出丰富多彩的声音效果。例如,在交响乐中,指挥家会精心安排不同乐器的组合,以实现特定的音响效果。
  2. 音色表达:音色可以用来传达特定的情感和意境。例如,某些音色可能让人联想到温暖、安慰的感觉,而另一些音色则可能带来紧张、激昂的效果。作曲家和演奏家可以通过巧妙地运用音色,增强音乐的表现力。
  3. 音色变化:在演奏中,音乐家可以通过改变乐器的演奏技巧或使用电子处理手段,创造出各种不同的音色效果。例如,吉他手可以通过拨片的形状和拨弦位置的变化,改变吉他的音色;电子音乐家则可以使用合成器、效果器等工具,对声音进行处理和塑造。
  4. 音色识别:在音乐欣赏和分析中,对音色的敏锐识别能力有助于理解作品的结构、风格和情感。训练良好的听众可以通过分析音色特征,辨别不同的乐器、声部和声音来源。

音色的研究和应用涉及音乐学、声学、心理学等多个学科领域。通过对音色的深入了解和探索,我们可以更好地理解音乐的奥秘,并且在创作和演奏中发挥更大的想象力。




Copyright © 2020-2023 BOB体育有限公司 版权所有