必应搜索(搜索必应国际版)
【点击查看】低成本上班族靠谱副业好项目 | 拼多多无货源创业7天起店爆单玩法
【点击查看】逆林创业记 | 拼多多电商店铺虚拟类项目新玩法(附完整词表&检测工具)
【点击查看】逆林创业记 | 小白ai写作一键生成爆文速成课
领300个信息差项目,见公众号【逆林创业记】(添加请备注:网站)
上次更新时间:2024 年 11 月
对于早期版本,请参阅此处。
我们的搜索方法
我们认识到,在我们这个技术驱动的世界中,搜索引擎在许多方面都是通往互联网的门户,也是人们在数以万亿计、不断变化的在线网页中找到所需内容的主要途径。 像必应这样的搜索引擎在维护自由和开放获取信息和自由表达的基本权利方面发挥着重要作用,我们努力帮助用户找到他们所寻求的最有用和最相关的信息。 同时,我们认识到,我们必须经常在访问信息权利与其他关键权利和利益(例如用户隐私或安全)之间保持平衡。 为了帮助指导我们如何确定应提供哪些页面以响应搜索查询,我们依赖于以下原则:
我们提供与用户查询相关的可信和权威的结果。
我们提倡在法律允许的范围内,并在尊重当地法律和其他基本权利(如隐私和公共安全)的前提下,自由、开放地访问信息。
我们采取措施保护用户免受有害和意外的冒犯性内容的影响。
我们对我们的原则和实践以及我们的决定和行动是透明的。
提示:如果网站上已经移除的信息仍然显示在必应搜索引擎中,可以使用“内容移除工具”提交页面移除或过时缓冲缓存移除请求。 若要详细了解内容移除工具,请转到必应网站管理员帮助和操作指南。
搜索的基础知识
返回搜索结果并非易事,而是涉及复杂、近乎即时的算法计算。 搜索像“猫”这样简单的东西可能会产生超过 5500 万个结果。 那么,我们如何选择要首先显示的结果呢? 我们首先进行爬网,并为可用网页编制索引。 然后,我们使用算法对该内容进行排名和优化,以便为用户提供最佳、质量最高的搜索结果。
下面详细介绍了每个步骤。
必应如何爬网
构建搜索的第一步是找出互联网上存在哪些页面,以便为它们编制索引 - 这通常称为爬网。 在必应,我们将我们的爬网程序亲切地称为“Bingbot”。 爬网是 Bingbot 发现要添加到搜索索引的新的和更新的页面与内容的方式。 Bingbot 使用算法来决定爬网内容和爬网频率,以尽量减少对网站的影响。 我们都是关于效率的,即使我们每天爬行数十亿个 URL。 我们会优先考虑尚未编制索引的相关已知页面,以及我们认为已更新的已知页面,以帮助提供最新结果。
必应如何编制索引
当 Bingbot 爬网时,它会向必应发送有关它找到的内容的信息。 然后将这些页面添加到必应索引,并使用算法分析页面,以便我们可以有效地将其包含在搜索结果中,包括确定哪些网站、新闻文章、图像或视频将包含在索引中,并在用户搜索特定关键字时提供。 在此处详细了解必应如何查找页面和编制索引。
必应如何对搜索结果进行排名
复杂算法通过将用户的搜索查询与索引中的第三方网页匹配,生成 Microsoft 必应搜索结果。 必应设计并不断改进其算法,以提供最全面、最相关、最有价值的搜索结果集合。
鉴于 Internet 的规模和搜索引擎操作的复杂性,必应依靠机器学习来确保用户在 Web 上数万亿页的内容中看到查询对应的最佳结果。 机器学习是一门科学,它通过识别数据中的模式并根据一小部分示例进行归纳,使计算机无需显式编程即可采取行动。 对于 Web 排名来说,这意味着构建一个模型,通过观察一些理想的结果来了解哪些特征最能预测其有用性,依赖于自动化信号(例如用户与必应网站的交互),以及训练由人工评委和/或在人工监督下的 AI 系统标记的数据。 必应指导其评委以确保其评估符合必应的排名目标,持续监视和监督其排名系统,并根据需要调整做法以确保搜索结果符合必应的原则。
排名的主要参数
下面简要概述了必应对搜索结果中的页面进行排名所用的主要参数。 这些参数按重要性的一般顺序列出。 必应的复杂系统使用这些条件来提供搜索结果。 以下每个参数的相对重要性可能因搜索而异,并随时间推移而变化。
用户参与度:必应还会考虑用户与搜索结果的交互情况。 为了确定用户参与度,必应会提出以下问题:用户是否点击给定查询的搜索结果,如果是,是哪些结果? 用户是花时间查看他们点击的这些搜索结果还是快速返回必应? 用户是否调整或重新制定了查询? 对于网站管理员来说,必应网站管理员仪表板可以让他们了解用户与网页的交互情况。
新鲜度:一般情况下,必应首选新鲜内容。 始终提供最新信息的页面被视为最新页面。 在许多情况下,今天制作的内容在多年后仍有意义。 但在某些情况下,今天制作的内容会很快过时。
位置和语言:在排名结果中,必应会考虑用户的位置(国家/地区和城市)、托管页面的位置、页面的语言以及页面其他访问者的位置。
页面加载时间:页面加载过慢可能会导致访问者离开网站,甚至可能在内容加载之前离开网站,以在其他地方查找信息。 在大多数情况下,必应会认为这是糟糕的用户体验和不太有用的搜索结果。
个人数据的使用
必应会使用特定于个人用户的信息来提高相关性和性能。 此信息包括搜索历史记录、位置、语言、设备特征(例如操作系统或浏览器),以及用户使用的是移动设备、平板电脑还是台式机。 用户可以通过必应设置更新其位置、语言和其他设置,并删除隐私仪表板上的搜索历史记录。
付费内容和 Microsoft 推广的内容
网站可能会选择通过Microsoft广告在必应上做广告;搜索结果中显示的付费广告将按此方式进行标记。 必应不允许网站通过付费提高其有机排名位置(“蓝色链接”)。 付费搜索广告在广告搜索结果中的方式。
必应不会将Microsoft产品或服务优先于算法搜索结果中的第三方产品和服务。 在有机搜索结果之外,必应有时会提供一个独立的答案框或横幅,当与提供的搜索词相关时宣传 Microsoft 产品或服务。
业务性质
网站上提供的商品或服务的特征不会影响必应排名结果的方式,除非内容对用户具有潜在的冒犯性或危害。 例如,当用户将安全搜索设置为“严格”模式时,将不显示提供成人内容的页面。 又例如,宣传潜在有害内容的页面(如宣传自杀方法或声称销售阿片类药物或其他潜在有害药物的网站页面),将被视为低权威性内容。
增强的搜索体验
除了核心算法搜索功能外,必应还为用户提供了其他功能,以帮助提供其他上下文和信息,并增强搜索体验。 例如,如果用户想知道哪支球队在昨晚的比赛中获胜,当用户在必应上搜索团队名称时,他们可能会看到最终分数和页面顶部的回顾,这是一个快照必应搜索,其中包含有关团队、新闻、视频和相关搜索的详细信息以及最相关的搜索结果。 为了帮助用户更轻松地找到所需内容,我们还允许用户使用图像、视频、新闻和购物等类别缩小搜索结果范围。 这些功能也依赖于上述排名原则和主要参数,但在某些情况下还会考虑其他因素,以便为用户提供最高质量、最相关的结果。 在某些情况下,必应可能会确定特定搜索查询不适合这些增强的搜索功能,但始终确保用户可以在蓝色链接中找到相关信息。 下面提供了有关这些功能的更多详细信息。
答案
“答案”是必应对增强型搜索结果的描述,通常位于搜索结果的顶部或侧面,它提供了更丰富的内容来回复用户的查询,通常是对所提问题的直接回答,或提供更多相关资源。 例如,如果用户键入“埃菲尔铁塔有多高?” 必应将以“330米”的答案做出响应,使用户能够快速找到所需的信息,以及一个侧边栏窗格,其中包含有关埃菲尔铁塔的详细信息,包括有关埃菲尔铁塔建成时间、位置和其他详细信息的有趣事实。 对于“这些查询,必应查看整个 Web 的搜索结果,返回汇总的答案,并链接到其来源。 其中一些答案可能由生成 AI 提供支持,以提供更丰富的体验,并链接到关键源。
如果查询与某个企业相关,必应可能会返回有关该企业的相关信息,例如商店营业时间和位置。 企业所有者可以使用 Bing Places for Business(在有限市场中提供)宣称和验证现有商品信息,以创建、编辑或更新其商品信息。 在某些情况下,必应可能会与第三方内容提供商(如本地餐厅评论网站)合作,以进一步增强用户体验
图像和视频体验
必应的图像和视频体验向用户提供与其搜索查询相关的图像和视频结果,这些结果可以出现在图片和视频垂直页面,也可以出现在与用户查询相关的图片或视频内容的主要搜索结果页面。 与主要网络搜索结果页面相同一样,图像和视频体验中的排名通常也依赖于相同的参数,即相关性、质量、新鲜度、权威性和热门程度。 当用户首次登录图像或视频体验主页时,在输入查询之前,主页将根据以前与网站的交互(例如用户的搜索历史记录、与图像结果的互动、保存的图像,以及 Edge 浏览历史记录[需征得用户允许])显示推荐的内容。 用户可以控制此体验,方式包括从隐私面板删除用于影响个性化的数据、利用同意将 Microsoft Edge 浏览活动用于个性化广告和体验,或者启动新会话(如果他们未登录)。 在某些市场中必应搜索,必应还提供了一项名为“必应保存”(Bing Saves) 的功能,该功能允许经过身份验证的用户维护相关图像链接的集合。 必应保存中的用户活动受 Microsoft 服务协议和行为准则的约束。
地图
在必应地图体验中,或在查询表明定位意图的主要搜索结果页上,用户可以在搜索栏中键入查询,地图将显示该搜索附近的位置列表或精确定位特定地址。 必应地图依赖于获得许可和公开提供的位置数据,并使用上述排名参数。 企业可以通过向 Bing Places 注册,并向必应用户提供与该企业相关的最新信息(例如位置、联系信息和营业时间),来提高必应地图结果的准确性。
新闻
必应有一个名为“必应新闻”的专门新闻主页,它可以为必应用户策展新闻内容。 如果相关,必应可能还会在从必应新闻内容拉取的main搜索结果页上显示一个以新闻为中心的答案框。
虽然必应新闻依赖于与必应相同的main参数来排名结果,但必应新闻搜索结果中显示的内容必须符合必应新闻发布者指南(必应新闻发布中心详述)。 有兴趣包含在必应新闻索引中的网站可以通过 PubHub 申请。 如果第三方网站和 或 Microsoft Start (上都提供同一篇文章作为Microsoft许可内容) ,必应新闻搜索结果可能会显示该内容的“Microsoft开始”版本。 这可以实现更一致、更高质量的用户体验。 必应中显示的许可 Microsoft Start 内容标记了标签“由 Microsoft Start 提供支持”。
购物
必应购物是一项搜索功能,通过返回来自网络和广告商的相关购物结果,帮助用户在单一视图上发现来自多个卖家的产品。 在某些情况下,购物体验可能会使用生成 AI 工具来为用户提供更好的结果。 在某些情况下,Microsoft可能会为单击算法生成结果的用户获得补偿,但此类补偿对向用户显示的算法生成结果的排名或相关性没有影响。
必应购物还可以根据之前参与购物体验,提供与用户查询相关的优惠券,或者在用户允许的情况下提供优惠券。 在某些情况下,Microsoft可能会因使用优惠券和通过必应购物而获得收入,但是否获得收入份额付款并未纳入必应向用户显示的优惠券排名中。
必应购物还提供生成 AI 功能,例如购买指南和专家评审摘要/用户评审摘要,以进一步帮助用户有效地做出购物决策。 这些功能是根据Microsoft负责任 AI 标准进行设计、构建和测试的。 由于 LLM 偶尔可能会出错,因此会向用户提供适当的信息,以确保用户了解这些限制。
允许Microsoft收集和使用个人数据进行个性化设置和广告的用户可能会在购物垂直中看到符合其兴趣的结果:用户可以访问Microsoft隐私仪表板或 Edge 购物切换开关,以选择加入或退出个性化广告,并控制影响个性化设置的数据。
安全搜索
安全始终是必应的首要任务。 我们有多种方法可帮助保护用户的安全,包括始终使用安全的 https Web 连接、在我们认为网站包含恶意软件时通知用户、让用户通过安全搜索控制他们看到的内容,以及通过与 Windows 家庭安全集成来帮助照顾者保护其子女。 我们的安全搜索功能有助于将成人内容排除在搜索结果中。 访问安全搜索设置以对此体验进行更改。
建议
自动建议和相关建议(以下称“建议”)是必应提供的查询建议,可帮助用户更方便地使用搜索和聊天。 自动建议功能可在用户开始在查询框中键入时预测搜索查询,从而帮助用户更快地完成搜索。 相关建议是一项功能,在搜索结果旁边显示用户可能感兴趣的主题 (例如,“人员也可能询问”) 。 同样,必应在其聊天体验中提供对话主题建议。
建议是根据必应上相关搜索的热门程度以及其他相关性信号(如搜索历史记录、趋势、位置和语言)通过算法生成的。 必应的建议还使用基于查询集训练的自然语言生成技术来帮助预测用户的预期查询。
生成式 AI 功能
必应包括某些生成 AI 功能,这些功能在 Microsoft各种先进技术上运行,包括 GPT、 (LLM) 的尖端大型语言模型 GPT,以及 DALL-E(一种深度学习模型,用于从 OpenAI 中的自然语言描述生成数字图像)。 在公开发布前几个月,我们在这两个模型上合作了几个月,以开发一组自定义的功能和技术,以将这一尖端 AI 技术和 Web 搜索加入到新的必应中。 例如,必应有时会在必应main搜索结果页面顶部显示 LLM 生成的汇总结果,以响应用户查询,使搜索体验更加轻松快捷。 另一个示例:在必应购物中,我们提供 AI 生成的购买指南和专家评审摘要/用户评审摘要,以帮助用户有效地做出购物决策。
在 Microsoft,我们认真对待负责任的 AI 承诺。 必应的生成 AI 体验已按照Microsoft的 AI 原则、Microsoft的负责任 AI Standard开发,并与公司内负责任的 AI 专家(包括Microsoft的负责任 AI 办公室、我们的工程团队、Microsoft研究和 Aether)合作开发。 可 在此处Microsoft了解有关负责任 AI 的详细信息。
识别、衡量和缓解风险
与其他转型技术一样,利用 AI 的优势并非无风险, Microsoft负责任 AI 计划 的核心部分旨在识别潜在风险,衡量其发生倾向,并构建缓解措施来解决这些问题。 在 AI 原则和负责任的 AI Standard的指导下,我们寻求识别、衡量和缓解潜在风险,同时确保新体验提供的变革性和有益的用途。 在以下各节中,我们将介绍用于识别、衡量和缓解潜在风险的迭代方法。
发现
在模型级别,我们的工作始于 2022 年夏末对GPT-4的探索性分析。 这包括与 OpenAI 合作进行广泛的红队测试。 此测试旨在评估最新技术的工作原理,而无需应用任何额外的安全措施。 我们当时的具体意图是产生有害的反应,发现潜在的滥用途径,并确定功能和限制。 我们在 OpenAI 和 Microsoft 方面的综合学习有助于模型开发的进步,对于我们在 Microsoft,我们了解了风险,并为必应生成 AI 功能的早期缓解策略做出了贡献。
除了模型级红队测试外,一个多学科专家团队还对以前的 必应中的 Copilot AI 体验进行了多轮应用程序级红队测试,然后在我们的有限版本预览版中公开提供这些体验。 此过程帮助我们更好地了解了攻击者如何利用系统,并改进我们的缓解措施。 非对抗性压力测试人员还广泛评估了新的必应功能是否存在缺点和漏洞。 发布后,必应中的新 AI 体验已集成到必应工程组织现有的生产测量和测试基础结构中。 例如,来自不同区域和背景的红队测试人员持续且系统地尝试破坏系统,他们的发现结果用于扩展必应用于改进系统的数据集。
度量
红队测试和压力测试可能会发现特定风险的实例,但在生产环境中,用户在必应中具有不同级别的搜索意向的各种查询。 为了更好地了解和解决必应生成 AI 体验中的潜在风险,我们开发了指标来衡量向用户显示有害内容的潜在风险。 这些指标用于新功能评估,作为负责任 AI 评审的一部分,以及在发布后持续监视功能。 我们还通过部分自动化的测量管道实现了大规模测量。 每次更改产品、更新现有缓解措施或提出新的缓解措施时,我们都会更新我们的度量管道,以评估产品性能和负责任的 AI 指标。
我们的测量管道使我们能够快速对潜在风险进行大规模测量。 在通过预览期和正在进行的红队测试发现新问题时,我们会继续扩展度量集以评估其他风险。
减轻
由于我们通过红队测试和压力测试等流程识别了潜在风险和滥用情况,并使用上述创新方法对其进行了测量,因此我们针对用于传统搜索的缓解措施开发了其他缓解措施。 下面,我们将介绍其中的一些缓解措施。 我们将继续监视必应中的生成 AI 体验,以提高产品性能和缓解措施。
随着我们了解详细信息,我们识别、衡量和缓解风险的方法将继续发展,并且我们会根据收集的反馈不断进行改进。
改进搜索结果
研究和测试
在用户看到必应的改进或新增功能之前,我们一直在幕后努力工作。 我们的研究人员经常招募用户来尝试新功能,并向我们提供意见。 在他们感到满意后,我们会向一小部分真实用户发布该功能,以了解他们与该功能的交互情况。 当绿灯亮起时,我们会将其发布给每个人。 但它并没有就此结束。 每个功能发布后,我们会定期监视使用情况和反馈,以评估哪些部分有效以及如何改进。
文章评论(0)