您的位置:首页 > 互联网

干货!如何使用 ChatGPT 进行有效总结_chatsupport

发布时间:2023-07-20 16:46:08  来源:互联网     背景:

本文讨论了如何使用 ChatGPT 作为自定义应用程序的摘要代理的最佳实践。摘要代理是压缩信息并提供跨多个应用程序和平台对相关内容的快速访问的重要工具。通过使用 ChatGPT,我们可以对文本进行摘要和标准化,并识别评论的情绪和类别。

然而,需要注意的是,ChatGPT 在严格遵守摘要中的字符或字数限制方面可能存在局限性。分词器是影响 ChatGPT 字数统计的关键因素,因此无法精确控制字数。建议在构建应用程序时将提示视为一个迭代过程,并在一批示例中测试和改进提示,以获得一致和准确的输出。

红米k60实时发布时间

chat怎么样

此外,了解在使用 ChatGPT 进行摘要时的优缺点,以及使用提取任务代替摘要可以获得更好的结果。最后,需要注意 ChatGPT 可能优先考虑连贯性和相关性,而不是严格遵守字数统计。因此,可能需要采取额外的步骤来确保符合特定格式要求。

如何使用ChatGPT 进行有效总结?下面将通过这几个例子来进行探索:

示例:电子商务评论

考虑上面的示例,其中我们有兴趣处理电子商务网站上给定产品的所有评论。我们有兴趣处理诸如以下有关我们明星产品的评论:第一台儿童电脑!

12345678910111213prod_review="""Ipurchasedthischildren'scomputerformyson,\andheabsolutelyadoresit.Hespendshoursexploring\itsvariousfeaturesandengagingwiththeeducationalgames.\Thecolorfuldesignandintuitiveinterfacemakeiteasyfor\himtonavigate.Thecomputerisdurableandbuiltto\withstandroughhandling,whichisperfectforactivekids.\Myonlyminorgripeisthatthevolumecouldbeabitlouder.\Overall,it'sanexcellenteducationaltoythatprovides\hoursoffunandlearningformyson.Itarrivedadayearlier\thanexpected,soIgottoplaywithitmyselfbeforeIgave\ittohim."""

在这种情况下,我们希望 ChatGPT 能够:

  • 将评论分为正面或负面。
  • 提供20字的评论摘要。
  • 使用具体结构输出响应,将所有评论标准化为一种格式。

实施说明

以下是我们可以用来从自定义应用程序提示 ChatGPT 的基本代码结构。我还提供了Jupyter Notebook的链接,其中包含本文中使用的所有示例。

123456789101112131415161718192021222324252627282930importopenaiimportosopenai.api_key_path="/path/to/key"defget_completion(prompt,model="gpt-3.5-turbo"):"""ThisfunctioncallsChatGPTAPIwithagivenpromptandreturnstheresponseback."""messages=[{"role":"user","content":prompt}]response=openai.ChatCompletion.create(model=model,messages=messages,temperature=0)returnresponse.choices[0].message["content"]user_text=f"""<Anygiventext>"""prompt=f"""<Anypromptwithadditionaltext>\"\"\"{user_text}\"\"\""""#AsimplecalltoChatGPTresponse=get_completion(prompt)

该函数使用给定的提示get_completion()调用 ChatGPT API。如果提示包含其他用户文本(例如我们示例中的评论本身),则它会通过三引号与其余代码分隔开。

让我们使用get_completion()提示ChatGPT的功能吧!

以下是满足上述要求的提示:

12345678910prompt=f"""Yourtaskistogenerateashortsummaryofaproduct\reviewfromane-commercesite.\Summarizethereviewbelow,delimitedbytriple\backticks,inexactly20words.Outputajsonwiththe\sentimentofthereview,thesummaryandoriginalreviewaskeys.\Review:```{prod_review}```"""response=get_completion(prompt)print(response)

⚠️ 本示例中使用的提示指南(例如使用分隔符将输入文本与提示的其余部分分开以及要求结构化输出)在我从 OpenAI 提示工程课程中学到的内容 — 提示指南中有完整解释。

以下是 ChatGPT 的回答:

12345{"sentiment": "positive","summary": "Durable and engaging children's computer with intuitive interface and educational games. Volume could be louder.","review": "I purchased this children's computer for my son, and he absolutely adores it. He spends hours exploring its various features and engaging with the educational games. The colorful design and intuitive interface make it easy for him to navigate. The computer is durable and built to withstand rough handling, which is perfect for active kids. My only minor gripe is that the volume could be a bit louder. Overall, it's an excellent educational toy that provides hours of fun and learning for my son. It arrived a day earlierthan expected, so I got to play with it myself before I gave it to him."}

正如我们从输出中可以观察到的那样,评论是准确且结构良好的,尽管它遗漏了我们作为电子商务所有者可能感兴趣的一些信息,例如有关产品交付的信息。

重点总结<运输和交付>

我们可以迭代地改进要求 ChatGPT 关注摘要中某些内容的提示。在这种情况下,我们对有关运输和交付的任何详细信息感兴趣:

123456789101112131415prompt=f"""Yourtaskistogenerateashortsummaryofaproduct\reviewfromanecommercesite.\Summarizethereviewbelow,delimitedbytriple\backticks,inexactly20wordsandfocusingonanyaspects\thatmentionshippinganddeliveryoftheproduct.\Outputajsonwiththesentimentofthereview,\thesummaryandoriginalreviewaskeys.\Review:```{prod_review}```"""response=get_completion(prompt)print(response)

这次,ChatGPT 的答复如下:

全球半导体行业的现状

12345{"sentiment": "positive","summary": "Durable and engaging children's computer with intuitive interface. Arrived a day earlier than expected.","review": "I purchased this children's computer for my son, and he absolutely adores it. He spends hours exploring its various features and engaging with the educational games. The colorful design and intuitive interface make it easy for him to navigate. The computer is durable and built to withstand rough handling, which is perfect for active kids. My only minor gripe is that the volume could be a bit louder. Overall, it's an excellent educational toy that provides hours of fun and learning for my son. It arrived a day earlierthan expected, so I got to play with it myself before I gave it to him."}

现在审查更加完整。提供有关原始审查的重点的详细信息对于避免 ChatGPT 跳过一些可能对我们的用例有价值的信息至关重要。

您是否注意到,虽然第二次试验包含有关交付的信息,但它跳过了原始评论的唯一负面方面?

让我们解决这个问题!

“摘录”代替“总结”

通过调查摘要任务,我发现如果用户提示不够准确,摘要对于法学硕士来说可能是一项棘手的任务。

当要求 ChatGPT 提供给定文本的摘要时,它可以跳过可能与我们相关的信息(正如我们最近经历的那样),或者它会对文本中的所有主题给予相同的重要性,仅提供对文本的概述要点。

法学硕士专家在完成这些类型的模型辅助的此类任务时,会使用术语“摘录”和附加信息来表达其关注点,而不是进行总结。

摘要旨在提供文本要点的简洁概述,包括与焦点主题无关的主题,而信息提取则侧重于检索具体细节,可以为我们提供我们正在寻找的内容。让我们尝试提取吧!

1234567891011121314prompt=f"""Yourtaskistoextractrelevantinformationfrom\aproductreviewfromanecommercesitetogive\feedbacktotheShippingdepartment.\Fromthereviewbelow,delimitedbytriplequotes\extracttheinformationrelevanttoshippingand\delivery.Use100characters.\Review:```{prod_review}```"""response=get_completion(prompt)print(response)

在这种情况下,通过使用提取,我们只能获得有关我们关注的主题的信息:Shipping: Arrived a day earlier than expected.

自动化

该系统适用于一次审查。然而,在为具体应用程序设计提示时,重要的是在一批示例中对其进行测试,以便我们可以捕获模型中的任何异常值或不当行为。

如果要处理多个评论,这里有一个可以提供帮助的示例 Python 代码结构。

12345678910111213141516171819reviews=["Thechildren'scomputerIboughtformydaughterisabsolutelyfantastic!Shelovesitandcan'tgetenoughoftheeducationalgames.Thedeliverywasfastandarrivedrightontime.Highlyrecommend!","Iwasreallydisappointedwiththechildren'scomputerIreceived.Itdidn'tliveuptomyexpectations,andtheeducationalgameswerenotengagingatall.Thedeliverywasdelayed,whichaddedtomyfrustration.","Thechildren'scomputerisagreateducationaltoy.Mysonenjoysplayingwithitandlearningnewthings.However,thedeliverytooklongerthanexpected,whichwasabitdisappointing.","Iamextremelyhappywiththechildren'scomputerIpurchased.It'shighlyinteractiveandkeepsmykidsentertainedforhours.Thedeliverywasswiftandhassle-free.","Thechildren'scomputerIorderedarriveddamaged,andsomeofthefeaturesdidn'tworkproperly.Itwasahugeletdown,andthedeliverywasalsodelayed.Notagoodexperienceoverall."]prompt=f"""Yourtaskistogenerateashortsummaryofeachproduct\reviewfromane-commercesite.Extractpositiveandnegativeinformationfromeachofthe\givenreviewsbelow,delimitedbytriple\backticksinatmost20wordseach.Extractinformationabout\thedelivery,ifincluded.\Review:```{reviews}```"""

以下是我们这批评论的摘要:

123451. Positive: Fantastic children's computer, fast delivery. Highly recommend.2. Negative: Disappointing children's computer, unengaging games, delayed delivery.3. Positive: Great educational toy, son enjoys it. Delivery took longer than expected.4. Positive: Highly interactive children's computer, swift and hassle-free delivery.5. Negative: Damaged children's computer, some features didn't work, delayed delivery.

⚠️ 请注意,尽管我们的提示中摘要的字数限制足够清楚,但我们可以很容易地看到,在任何迭代中都没有实现此字数限制。

字数统计中出现这种不匹配的情况是因为法学硕士对字数或字符数没有准确的理解。这背后的原因依赖于其架构的主要重要组件之一:标记器。

分词器

ChatGPT 等旨在根据从大量语言数据中学习到的统计模式生成文本。虽然它们在生成流畅且连贯的文本方面非常有效,但它们缺乏对字数的精确控制。

在上面的示例中,当我们给出有关非常精确的字数统计的说明时,ChatGPT 很难满足这些要求。相反,它生成的文本实际上短于指定的字数。

在其他情况下,它可能会生成较长的文本或只是过于冗长或缺乏细节的文本。此外,ChatGPT 可能会优先考虑其他因素,例如连贯性和相关性,而不是严格遵守字数统计。这可能会导致文本在内容和连贯性方面具有高质量,但并不完全符合字数要求。

分词器是 ChatGPT 架构中的关键元素,它明显影响生成输出中的单词数量。

分词器架构

分词器是文本生成过程的第一步。它负责将我们输入到 ChatGPT 的文本片段分解为单独的元素(标记),然后由语言模型处理以生成新文本。

当分词器将一段文本分解为标记时,它会根据一组旨在识别目标语言的有意义单元的规则来完成此操作。然而,这些规则并不总是完美的,并且在某些情况下,分词器会以影响文本总字数的方式拆分或合并标记。

例如,考虑以下句子:“我想吃花生酱三明治”。如果分词器配置为根据空格和标点符号分割标记,则它可能会将此句子分解为以下标记,总字数为8,等于标记计数。

chat partner怎么用

然而,如果分词器配置为将“花生酱”视为复合词,则它可能会将句子分解为以下标记,总字数为8,但标记数为7。

chattype

因此,分词器的配置方式可能会影响文本的总体字数,这可能会影响法学硕士遵循有关精确字数计数的说明的能力。虽然一些分词器提供了自定义文本分词方式的选项,但这并不总是足以确保精确遵守字数统计要求。对于本例中的ChatGPT,我们无法控制其架构的这一部分。

这使得 ChatGPT 不太擅长完成字符或单词限制,但可以尝试使用句子来代替,因为分词器不会影响句子的数量,而是影响句子的长度。

了解此限制可以帮助您为您的应用程序构建最合适的提示。了解了 ChatGPT 上字数统计的工作原理后,让我们对电子商务应用程序的提示进行最后一次迭代!

总结:电子商务评论

让我们将从本文中学到的知识结合到最终的提示中!在这种情况下,我们将要求结果的HTML格式以获得更好的输出:

1234567891011121314151617fromIPython.displayimportdisplay,HTMLprompt=f"""Yourtaskistoextractrelevantinformationfrom\aproductreviewfromanecommercesitetogive\feedbacktotheShippingdepartmentandgenericfeedbackfromtheproduct.Fromthereviewbelow,delimitedbytriplequotes\constructanHTMLtablewiththesentimentofthereview,generalfeedbackfromtheproductintwosentencesandinformationrelevanttoshippingand\delivery.Review:```{prod_review}```"""response=get_completion(prompt)display(HTML(response))

这是 ChatGPT 的最终输出:

chat怎么样

来自Jupyter Notebook的自制屏幕截图以及本文中使用的示例。

总结:

在本文中,我们讨论了使用 ChatGPT 作为自定义应用程序的摘要代理的最佳实践。

我们看到,在构建应用程序时,要在第一次尝试中就得出符合您的应用程序要求的完美提示是极其困难的。我认为一个很好的带回家的信息是将提示视为一个迭代过程,您可以在其中完善和建模提示,直到获得所需的输出。

通过迭代地完善您的提示并将其应用到一批示例,然后再将其部署到生产中,您可以确保输出在多个示例中保持一致并覆盖异常响应。在我们的示例中,可能有人提供随机文本而不是评论。我们可以指示 ChatGPT 也有一个标准化输出来排除这些异常响应。

此外,当使用 ChatGPT 执行特定任务时,了解使用 LLM 执行目标任务的优缺点也是一个很好的实践。这就是我们如何认识到这样一个事实:当我们想要对输入文本进行类似人类的通用摘要时,提取任务比摘要更有效。我们还了解到,提供摘要的重点可以改变生成内容的游戏规则。

比亚迪旗下高端mpv 腾势d9首台量产车正式下线

最后,虽然法学硕士在生成文本方面非常有效,但它们并不适合遵循有关字数统计或其他特定格式要求的精确说明。为了实现这些目标,可能需要坚持句子计数或使用其他工具或方法,例如手动编辑或更专业的软件。


返回网站首页

本文评论
快更新!iOS出现严重安全漏洞:黑客可直接盗取你的通讯录
苹果近日发布了iOS 16 /iPad OS 15的更新,主要是为了修复一系列漏洞,提高设备的安全性。这些漏洞如果不及时修复,可能会被黑客利用,造成用户的隐私泄露或数据损失。被智能机器人...
日期:05-19
马斯克其父「马斯克父亲不看好儿子:和小扎约架是双输局 会“彻底蒙羞”」
快科技6月28日消息,近日,特斯拉CEO马斯克和 Facebook CEO扎克伯格在网上隔空约架”,要进八角笼进行格斗一事,引起网友热议关注。马斯克表示,对约架一事,这真的可能会发生”。如果...
日期:06-28
动感地带芒果卡携手时代少年团踏浪而上7月8日 开启预售「移动动感地带芒果会员」
20岁是逐梦前行的少年梦想,是活力满分的炙热情怀,正值20岁的中国移动动感地带品牌,将推出动感地带芒果卡,向世界展示赤诚的少年初心和不设限的青春姿态。2023年7月8日动感地带芒...
日期:07-08
理想发布L8、L7两款新车 售价33.98-39.98万元
凤凰网科技讯9月30日消息,今天,理想汽车正式发布了中大型SUV理想L8和五座SUV理想L7。理想L8将提供Max和Pro两个版本,售价上,理想L8Pro全国统一零售价格35.98万元,理想L8Max全国统...
日期:10-01
苏宁818免费办理5G体验套餐,每月100G流量包_119元5g畅享套餐
  8月16日,华为首款5G手机Mate 20 X (5G)正式开售,苏宁线上线下全渠道多业态同步售出第一批华为5G手机。与此同时,针对首批5G手机上市,苏宁易购还联手三大运营商,为用户免费办...
日期:02-10
一家一户购物网的“土鳖式”B2C创新(b2c网上购物平台)
在人们谈论电子商务和在线网购时,大家基本上都在说淘宝和卓越当当,很少人去关注那些在快速成长的中小电子商务企业,北京一家一户购物网就是这些静悄悄地 飞速发展的本土电子商...
日期:07-29
家电“四大件”年产量近亿台 全球10%笔记本电脑都在安徽生产_中国笔记本电脑产量
在国内的工业生产链上,安徽省占据了相当大的一个份额,为国内工业的重要生产基地。10月17日消息,据安徽日报报道,2021年,安徽全省生产总值近4.3万亿元,人均生产总值超过1万美元,社会...
日期:10-22
李彦宏:人工智能发展多年,商业是其中软肋_智能经济李彦宏
  9月1日,在2022世界人工智能大会,百度创始人、董事长兼首席执行官李彦宏在开幕式上发表视频演讲,李彦宏表示,人工智能发展多年,商业是其中的软肋,而缺乏好的商业前景会让创业公...
日期:09-05
陆正耀与瑞幸狭路相逢「瑞幸老板陆正耀」
文章目录 库迪咖啡的三个亮点 想问陆正耀的四个问题 声明:本文来自于微信公众号刺猬公社(ID:ciweigongshe),作者:张 展,授权转载发布。兜兜转转,陆正耀又回到了咖啡赛道。离开瑞幸...
日期:11-02
特斯拉投资者日开幕 全球副总裁朱晓彤:目标为每45秒生产一辆车
北京时间3月2日,特斯拉首次投资者日开幕,特斯拉全球副总裁朱晓彤上台分享了相关成果。朱晓彤首先宣布,特斯拉产量达到了400万辆的里程碑,第400万辆车今天在得州工厂生产,而特斯拉...
日期:03-02
助力睡眠、血氧等数据监测,华米科技发布新一代自研传感器 BioTracker 2
  6 月 15 日,全球领先的智能穿戴公司华米科技(NYSE:HMI)在中国合肥召开首届华米科技 AI 创新大会。在“AI to Decode Future”的主题下,华米科技向全世界公布了一系列全新...
日期:07-14
一张图看懂 | 2022年全球100个最有价值品牌「2021年全球十大最有价值品牌」
10月28日 消息:确定品牌的财务价值不是一件简单的事情。尽管一个品牌是无形的,但一个强大的品牌在提升公司盈利方面起着重要的作用。iqoo1500元左右手机推荐4.43英寸考虑到这...
日期:11-03
腾讯云首次完整披露星脉高性能计算网络,可支持10万卡超大算力集群
腾讯云首次完整披露星脉高性能计算网络,可支持10万卡超大算力集群 通信产业网|2023-06-27 11:54:09作者:通文来源:通信产业网【通信产业网讯】AIGC的爆发除了带来算力上的挑战,...
日期:06-27
南通移动推进绿色机房建设助力节能减排「机房节能减排方案」
通信世界网消息(CWW)近日,南通移动积极响应国家“节能减排”号召,持续探索基站节能新举措,大力推进绿色机房建设,开展重力热管型精密节能空调试点,推动室外柜OLT建设开通,为碳中和、...
日期:07-17
iqoo一代8+128「iQOO 11S 今日开售:骁龙 8 Gen 2 处理器 售价3799元起」
7月10日 消息:iQOO11S 将于今天上午10点开启首销,售价3799元起。具体为:12GB+256GB3799元、16GB+256GB4099元、16GB+512GB4399元、16GB+1TB4799元。iQOO11S智能手机搭载骁龙8...
日期:07-10
2021年五一民宿数据「五一民宿预订现涨价退单潮 住宿价格暴涨」
随着五一长假的到来,旅游业再次迎来了高峰期。但是,一些消费者在订购民宿的过程中却遇到了被涨价或取消订单的问题。有报道称,有消费者在订购木鸟民宿时,连续收到平台的电话,通知...
日期:04-21
上海车展最火「最“卷”一届车展启幕 千余家车企齐聚上海滩」
(原标题:最“卷”一届车展今日启幕!千余家车企齐聚上海滩!车企CEO悉数到场,“智电”江山!) 每经记者 董天意 每经编辑 孙志成 裴健...
日期:04-18
丫丫解锁新玩具竹笼:一刻也没闲着「竹丫丫图片」
6月29日消息,饲养员为丫丫”准备了新的玩具竹笼,成功引起了丫丫”的注意,熊猫丫丫面对竹笼,一刻也没闲着。看到这一幕,网友纷纷留言:还是家里好,想怎么玩怎么玩”、丫丫玩得好开心...
日期:06-30
华为正式发布企业智能工作平台WeLink(华为人工智能开发平台)
  12月26日下午消息,华为云今日发布智能工作平台WeLink。华为云副总裁、联接与协同业务总裁薛浩表示,华为云WeLink源自华为数字化转型实践,提供基础服务和增值服务两种类型,...
日期:07-11
a75主板支持什么显卡「英特尔Arc A770和A750显卡将于10月12日正式推出」
英特尔终于宣布了让玩家们期待已久的Arc显卡系列的硬性推出日期,其中,英特尔Arc A770和A750将首先推出,并将于10月12日上市。下面是A770的包装图:英特尔Arc A770是英特尔有史以...
日期:09-30