CHA:他做了一个「ChatGPT 杀手」，a16z 抢着投_ZERI币

比「GPT侦探」更重要的是，AI生成内容在不同行业的「容忍度」。

图片来源：由无界版图AI工具生成

作者|美漪编辑?|靖宇

最近两个月，科技圈最热的话题，无疑是OpenAI推出的对话式AI应用ChatGPT，不仅可以让它给你写一首诗、回答你的任何问题，甚至可以让它帮忙写没那么复杂的代码。业内甚至认为，ChatGPT甚至有取代谷歌的潜力。

为ChatGPT欢呼的还有另一群人，就是「社畜」和学生——他们发现月度总结、学校论文和作业这样的任务，也可以让ChatGPT代劳了，后者甚至写得有模有样，不比真人写得差多少。

ChatGPT似乎让学生们的日子更轻松了，但却让教师更「头疼」了，因为后者很难确认，眼前这些文字，到底是学生写的，还是出自OpenAI的产品之手。为此，纽约教育部甚至禁止公立学校使用ChatGPT。

在这样的混乱中，一位普林斯顿大学的学生，EdwardTian推出了一个专杀ChatGPT的应用——「GPTZero」，有了这面「照妖镜」，内容是人写的，还是机器写的，真相马上就揭晓。

「GPTZero」在网络迅速爆红，吸引了a16z在内的硅谷创投的目光。但是应用创造者本人Tian却认为，最重要的事，是「让AI更加透明」。

Data Gumbo推出工业级智能合约市场GumboStore:3月7日消息，工业智能合约网络公司Data Gumbo宣布推出首个工业级智能合约市场GumboStore。GumboStore使企业能够轻松创建、部署、发布或授权直观的智能合约模板，以消除商业关系中的交易和信息摩擦。

据悉，访问GumboStore的用户需要订阅Data Gumbo的全球企业智能合约网络GumboNet ?。（Businesswire）[2022/3/7 13:42:59]

「ChatGPT杀手」

在ChatGPT成为学生们「偷懒」的神器后，教育和科研机构不得不开始抵制这个新的噩梦。

纽约教育部宣布禁止学生在公立学校使用ChatGPT；全球知名机器学习会议之一的ICML也宣布禁止发表包含由ChatGPT和其他类似系统生成内容的论文，以免出现「意外后果」。

出于对学术界，使用ChatGPT相关道德问题的担忧，华人小哥EdwardTian在一家当地的咖啡店里，花了一个寒假的时间，研发了GPTZero，希望能让学术界恢复严谨性。

Tian年仅22岁，目前仍是美国普林斯顿大学的大四学生，主修计算机科学专业，专门研究自然语言处理，同时辅修认知科学和新闻学。

Data Gumbo完成770万美元B轮融资:区块链初创公司Data Gumbo完成770万美元B轮融资，Equinor Ventures领投, Saudi Aramco Energy Ventures、Bay Area和L37等参投。（BusinessWire）[2021/8/4 1:34:26]

GPTZero的开发者EdwardTian｜网络

他还曾是英国广播公司和开源情报网站Bellingcat的研究员，也曾是被微软收购的反恐初创公司MiburoSolutions的分析师。在那里，他监测虚假信息和机器人检测。Tian说，「所有的这些经历，都是他研发GPTZero的动力」。

2023年1月2日，Tian将GPTZero发布到网络，预计只会有几十个人尝试它，完全没有想过，这会掀起一场世界级别的轩然大波。

在他把这款软件上传到互联网上的几个小时内，竟有超过?2000人在Steamlit上测试了GPTZero的公开版本。

1月5日，也就是发布的第三天，Tian对GPTZero做出了更新和改善，还显著降低了误报率；此时，新程序已有超过?1万的用户量了！Tian也不禁对它的「爆炸性增长」和「病式传播」感到震惊。

Gate.io 开通GUM/USDT交易:据官方公告，Gate.io投票上币空投福利第132期Gourmet Galaxy(GUM) 投票上币活动结束，本次活动参与人数为 6,608，共投出26,544,193票。票数已超过1000万，符合上币要求。Gate.io已为用户空投18,600 GUM，并将于05月12日（明日）中午12:00 开通GUM/USDT交易与开通提现服务。[2021/5/11 21:47:07]

据NPR报道，一周内有?3万多人试用了GPTZero，甚至「导致该应用由于出乎意料的高网络流量」而崩溃，托管GPTZero的免费平台Streamlit此后介入，以更多的内存和资源支持Tian，以处理网络流量。

EdwardTian通过在视频中展示其对一篇《纽约客》文章和LinkedIn上的ChatGPT生成器的帖子的分析，展示了该应用如何区分人类和人工智能撰写的文本。

GPTZero的工作原理就是检测文本的「困惑性」和「突发性」这两项指标，并分别对其打分，根据统计学特征来确定，文本是由人工智能写的还是人类写的。总体来说，如果这两项参数得分都很低，那么该文本很有可能出自AI之手。

这里所说的「困惑性」，是指来自人类所写作品的语言的复杂性和随机性。

区块链公司Data Gumbo宣布Richard Dobbs担任董事会主席:区块链公司Data Gumbo宣布，Richard Dobbs已加入董事会担任主席。据悉，Dobbs在麦肯锡工作30年，此前担任麦肯锡全球研究院（MGI）院长。（Business Wire）[2020/8/27]

这个指标主要是衡量文本在一个句子中的随机程度，以及一个句子的构造方式是否会让GPTZero感到困惑。

每当用户在GPTZero输入一段测试内容，它就会分别计算出：「文字总困惑度」、「所有句子的平均困惑度」、「每个句子的困惑度」。

这些数值越低，越能说明这个文本对GPTZero来说是非常「熟悉」的，那么它很可能是AI生成的；相反，如果这些数值越高，就越能说明文本中句子的构造或用词方式让GPTZero感到「惊讶」，那么它就更可能是出自人类之手。

这是因为，人工智能接受过数据库的训练，生成的文本在一段时间内，表现出的困惑度会更均匀和恒定，选词的可预测性也更高；而人类书写的文本则不会这样，真人的遣词造句一般会比较随机，比机器更容易写比较出乎意料的词句。

使用GPTZero检测文字是否由ChatGPT生成｜Twitter

而「突发性」，则是指来自人类使用的句子结构的变化。

这个参数主要是比较句子复杂性的变化程度，衡量它们的一致性。

这是因为，人类倾向于写高度复杂的文本；而人工智能产出的文本则是低复杂度的；此外，由于人类的思维结构不是线性的，他们的句子结构也遵循类似的模式。

这意味着，人类使用句子结构，会在长而复杂的句子，和短而简单的句子之间摇摆不定，有着更多的句式变化，比如复杂和简单交替并存，一个长难句之后接着出现更简短的句子；而机器生成的句子则倾向于更加统一，很少会有一系列长度相差很大的句子。

简而言之，在选词上「简单」而「熟悉」，并使用「统一整齐」的句子，是人工智能生成作品的标志特征，而更复杂和多样的东西，则表明是人类写的。这也是「困惑性」和「突发性」这两项指标可以作为衡量标准的原因。

除了EdwardTian本人对GPTZero进行测试之外，也有不少网友用它对ChatGPT、一些GPT-3衍生工具生成的内容进行了多次测试。最终结果显示，GPTZero每次都能抓住AI生成的文本，并在十多个案例中正确识别了人类写的文本。

GPTZero的一炮而红，让Tian获得了来自a16z、MenloVentures和RedSwan等知名风投的青睐。不过，面对推特私信和电话轰炸，Tian却显得异常冷静，他谦逊地表示自己不会拒接投资者打来的电话，但他不会忘记自己仍然是一位即将毕业的大四学生。

同时，他还表示自己的GPTZero尚未完成，仍需改进和进一步地开发，甚至计划让大家继续免费使用他的程序，用来支持各地新晋英文老师的工作。

急需的「AI透明」

对于GPTZero这一甄别文字是否是AI写作的新程序，推特上的舆论褒贬不一，以教师为代表的成年人大多喜闻乐见，而学生却讽刺GPTZero的创造者Tian是「学术缉警察」。

的确，当GPTZero推出时，Tian收到了众多教师对该应用程序在检测AI写的文章方面的积极反馈，来自世界各地的无数教师也都对Tian表达了他们的感激之情——这让他们的教学难度大大减轻了。

当然，也不难理解，不少学生并不看好Tian这款打击学术偷工减料、不劳而获的软件。

事实上，不只是Tian，就连ChatGPT的开发商OpenAI自己，也已经表明了对防止人工智能剽窃的承诺。

2022年12月，OpenAI专注于人工智能安全的研究员ScottAaronson透露，该公司正在努力开发「缓解措施」，用一种「不易察觉的秘密信号」对GPT生成的文本打上「水印」，以识别其来源，从而打击作弊的系统。

这项技术将通过微妙地调整ChatGPT选择的特定单词选择来发挥作用，读者不会注意到这种方式，但对于任何寻找机器生成文本迹象的人来说，这在统计上都是可预测的。

公司发言人表示，「我们将ChatGPT作为新研究的预览技术，希望能从现实世界的应用中进行学习。我们认为这是开发和部署功能强大、安全的AI系统的关键部分。我们会不断吸取反馈和经验教训，」。

GPTZero首页｜GPTZero

此外，OpenAI还联合哈佛等高校机构联合打造了一款检测器：GPT-2OutputDetector。

作者们先是发布了一个「GPT-2生成内容」和WebText数据集，帮助AI理解机器语言和人类语言之间的差异。

随后，用这个数据集对RoBERTa模型进行微调，就得到了这个AI检测器。其中人类语言一律被识别为True，AI生成的内容则一律被识别为Fake。

值得一提的是，RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集，但RoBERTa使用了包含6300万条英文新闻的160GB数据集。

尽管如此，还是有不少人认为，「AI文本检测器」注定是一场失败的「军备竞赛」，其实际效果并不理想，更无法阻挡ChatGPT等AI语言模型的发展。

然而，尽管Tian建立了GPTZero，他并不反对使用ChatGPT等人工智能工具，他认为GPTZero应用程序的目的不是阻止这些新技术的使用，而是提供一种负责任地使用这些技术的方法，并提供必要的保护。

同时，相对于对抗或者禁止一项技术，也许更重要的是如何为其使用定下规范和标准。例如，在广告、影视及娱乐等行业，对于AI生成类内容的容忍度可能适当提高一些；而在学术、教育和科研领域，非常强调准确性和原创性，毫无疑问，对于AI生成内容的容忍度就要低一些。

而如何确定AI工具使用的「透明度」，可能要比研究如何「反AI」，要更有效，也更有意义一些。

本文为极客公园原创文章，转载请联系极客君微信geekparkGO

中文推特：https://twitter.com/8BTC_OFFICIAL英文推特：https://twitter.com/btcinchinaDiscord社区：https://discord.gg/defidao电报频道：https://t.me/Mute_8btc电报社区：https://t.me/news_8btc

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

Pol币NFT:Gumball：如何通过原生代币驱动NFT始终具备流动性？_business-credit-alliance-chain

NFT季节又回来了。当NFT价格上升,并且一直有愿意购买的人时,你会感到很有趣,但当交易量放缓,你无法为你的Jpeg找到愿意接盘的人时,这个游戏就不好玩了.

中币下载ERO:a16z投资的Arpeggi如何使用ARP协议革新音乐制作范式？_CHAT

大家都相信Web3将改变创作者经济,我们确实也看到了生成艺术、绘画等平面艺术的商业模式发生的改变,那么音乐呢？Web3音乐平台何去何从据估计,2022年全球数字音乐市场的总收入超过150亿美元.

POL币最新价格区块链:三分钟读懂Layer 0、1、2、3_Playermon

相信很多兄弟姐妹连Layer2都没整明白,现在又来了Layer0、Layer3,新技术名词太多,简直让人脑溢血.

火星币加密货币:各地区块链政策频出，扶持方向不外乎这些……_LAYER

无论是政府服务、能源、金融、城市管理等实体经济数字化领域,还是Web3.0、NFT、元宇宙等数字原生应用领域,均对数据要素全流程可信管理提出了更高要求.

区块博客

CHA:他做了一个「ChatGPT 杀手」，a16z 抢着投_ZERI币

区块博客