ASO“组词”技术看完这篇文章足够了!

当然,这个组词工具还给出了不考虑组词长度的结果,就是“最大限度组词”的结果。“最大限度组词”,其实已经把所有可能组合的词,都组到了一起,但还有用户经常会问,这样的组词还是有“逗号”存在,能不能干脆把全部的逗号都干掉,这样不是能加更多的词吗?根据上述的“词袋”模型,即使把所有的逗号都干掉,其关键词的“词袋”是没有变化的,因此对搜索的影响不是很大。

以下为知识DOC为大家进行整理的相关内容,希望对大家有所帮助!

所谓“组词”劲组词,就是把一些具有“共同部分”的词组合到一起,如App的关键词包含“腾讯新闻”和“网易新闻”这两个词,就可以组合成“腾讯网易新闻”,而用户搜索时,搜索“腾讯新闻”或“网易新闻”也还是能搜到该App的。

之所有“组词”的需求,主要是由于对填写的关键词长度有限制(不得大于100个字符),而我们需要填写的关键词串经常大于100字符,因此需要对填写的一堆词进行组词劲组词,对可以合并的词尽可能地进行合并,从而能在100字符内尽可能多地展示我们的app信息,增加app被搜索词命中的概率。

组词看似简单,网络营销学习但涉及搜索引擎的分词和检索的基础知识,如果对这些不清楚,就经常会产生如“支付宝”和“宝贝”能否组合成“支付宝贝”这样的疑惑。因此,本文就首先简要介绍下分词和搜索的基本知识,然后再讲下appbk的自动组词方法。

分词技术

现代搜索引擎,都是以“词”为基础单位进行设计的。词是最小的有意义的语言成分。英语等字母语言,其单词天然按照空格隔开,但中文等东亚语种,其词之间并没有明显的分隔符,因此就产生了“分词”的需求。“分词”就是把一个汉语字符串分成一个个词的过程。

分词的例子如“腾讯新闻”的分词为:“腾讯 | 新闻”,“网易新闻” 的为“网易 | 新闻”。

钊子自媒体博客:

钊子自媒体博客

由于中文分词经常会有“歧义”现象,如“兵乓球拍卖完了”可切分为“乒乓球 | 拍卖 |完了”又可以切分为“乒乓球拍| 卖 | 完了”,针对这种情况,搜索系统一般会把两种分词形式都记录下来,以供搜索时使用。

搜索的基础:词袋模型(word of bag)

“词袋模型”是搜索引擎中的一种简单假设,其不考虑词的“顺序”劲组词,认为一个文本就是

是一堆词的“集合”。也就是如两个文本“腾讯新闻”、“新闻腾讯”,对搜索引擎而言,是完全一样的。这种假设也是我们能够进行组词的基础。

我们还是以“腾讯新闻”和“新闻腾讯”,以及其组词“腾讯网易新闻”为例,其“词袋”模型如下图所示:

图1 “腾讯新闻”和“新闻腾讯”,及其组词“腾讯网易新闻”的词袋模型

由于“词袋”模型是一个“集合”模型,可以不考虑重复元素,因此上面袋子中的两个“新闻”可以视为一个。从上图中可以看到,“腾讯新闻”+“新闻腾讯”,和“腾讯网易新闻”的词袋模型是完全等价的,也就是说对搜索引擎而言,他们是完全一样的。

然后,我们还可以利用上述模型,简单描述用户搜索的过程。搜索的时候,搜索系统首先会在对用户输入的搜索词进行分词,然后在关键词的“袋子”里面依次查找搜索词的分词。还是上面的例子,如用户搜索“腾讯新闻”时,流程如下图所示:

图2 基于“词袋”模型的查找流程,搜索系统在“词袋”中分别查找“腾讯”和“新闻”这两个搜索词的分词

然后我们再看下“支付宝”和“宝贝”的例子 ,说明为啥他们不能组词。我们把“支付宝”和“宝贝”组成“支付宝贝”,但其分词的时候,可能会分成“支付 | 宝贝”,这种分词歧义就可能造成搜索“支付宝”的时候,搜不到该App,具体如下图所示:

图3 关键词“支付宝”和“宝贝”组成“支付宝贝”后,由于可能的分词歧义,用户搜索“支付宝”时,可能会搜索不到该App。

组词方法

因为搜索系统是以“词”为基础单位进行检索的,因此,首先需要对关键词进行“分词”。然后就是具体的“组词”过程了。

“组词”就是一个分组的过程,我们利用的是机器学习中的“在线聚类”技术,其实就是把字符串中有相同子串的词组合在一起,然后不断循环,直到没有重合的词出现。组词过程中,我们考虑到苹果的规则,一个“词”不能过长,否则可能会被认为是关键词堆砌,因此,我们限制了组词的最大个数,就是最多组合5个词。

在appbk上有一个“组词工具”服务,具体见网站的菜单导航栏。它的“推荐组词”结果设置了最大组词个数限制,以‘美女直播,yy视频,交友网站,明星直播’为例,其在上面的组词结果如下图所示:

图4 appbk的组词服务

其中,‘美女直播’和明星直播两个词组合在了一起,省了两个字符和一个逗号的空间。

当然,这个组词工具还给出了不考虑组词长度的结果,就是“最大限度组词”的结果。

逗号问题

“最大限度组词”,其实已经把所有可能组合的词,都组到了一起,但还有用户经常会问,这样的组词还是有“逗号”存在,能不能干脆把全部的逗号都干掉,这样不是能加更多的词吗?

根据上述的“词袋”模型,即使把所有的逗号都干掉,其关键词的“词袋”是没有变化的,因此对搜索的影响不是很大。但考虑到下面的因素,并不建议这样做:

1、苹果规则限制。在2015年之前,很多ASO服务商给出的关键词建议都是没有任何逗号的,但这种情况多了后,苹果的关键词审核就会更严格,这样的形式会被认为是“关键词堆砌”,审核就不通过,因此,组词需要“适度”。

2、权重影响。根据“词袋”模型,用户搜索“腾讯新闻”时,关键词填写“腾讯新闻”或者“腾讯网易新闻”,是都能搜到的,这个是没有问题的。但是,关键词“腾讯新闻”与用户搜索词是完全一致的,这种情况,搜索引擎一般都会有少量的加分。

综合我们的一些实践经验,给出以下建议:

1、组词不宜过长,以不超过5个为宜。

2、对下载量较少的App,不需要刻意的组词,因为你的App基本处在长尾位置,一点点的加分,就可能让你的搜索排名有大幅提升。

3、对应需要“刷”的词,还有核心带量的关键词,建议都用逗号隔开,不进行组词。

本文地址: https://www.zhishidoc.com/14775.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 859089669@qq.com 举报,一经查实,本站将立刻删除。

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022年10月15日 上午5:14
下一篇 2022年10月15日 上午5:16

相关推荐

  • 祝贺病人恢复健康的祝福语

    祝贺病人恢复健康的祝福语(精选50句)下面是小编整理的祝贺病人恢复健康的祝福语(精选50句),仅供参考,大家一起来看看吧。6、日日病榻日日烦,逍遥快乐都吓跑,不要悲观和抱怨,远方有朋在掂念,望你健来祝你康,身体养好,吃嘛嘛香,祝早日康复!千言万语化为一句祝福:希望你早日康复!【祝贺病人恢复健康的祝福语(精选50句)】相关文章:祝贺新婚的祝福语06-08祝贺新婚的祝福语英文08-26

    2022年10月28日
    23800
  • 唯美的句子说说心情

    唯美的句子说说心情64句你是否有这个习惯,在阅读的时候,会收藏或者记录一些好的句子段落呢?【唯美的句子说说心情】相关文章:2016唯美的句子说说心情01-16唯美的句子说说心情60句08-17唯美的句子说说心情69句08-17优雅唯美的心情说说03-01唯美的说说心情短语03-01伤感唯美的心情说说05-05唯美的幽默说说心情05-12幸福唯美的说说心情05-20

    2022年9月28日
    13600
  • 第一次养花的说说句子有哪些

    精美的句子,常常以励志的句子、正能量的句子、唯美的句子、人生感悟的句子、伤感的句子、搞笑的句子等等面目出现,经过时间的淘洗,流传下来的往往简短而有深意。励志的句子网向您推荐第一次养花的说说句子有哪些,希望您能保持好心情。十五、阴雨天,第一次那么认真的想养花,这些花会带来好心情!二十九、长那么大头一回养花,感觉第一次当女人一样。读了“第一次养花的说说句子有哪些”,有没有一两句让您喜欢的短句?

    2022年10月26日
    13500
  • 风雨过后总会有彩虹的句子,风雨过后励志的句子

    5、人在旅途,难免会遇到荆棘和坎坷,但风雨过后,一定会有美丽的彩虹。人在旅途,难免会遇到荆棘和坎坷,但风雨过后,一定会有美丽的彩虹!31、人生旅途,有风雨兼程,也有雨后彩虹,只要风雨同舟,就能看到雨后彩虹。下面是小编精心准备的风雨过后总会有彩虹的句子,希望大家会喜欢,接下来就让我们一起来看一下。43、风雨过后不一定有美好的天空不是天晴就会有彩虹所以你一脸无辜不代表你懵懂不是所有感情都会有始有终

    投稿 2022年10月21日
    16700
  • 爆笑经典差评冷笑话,糗事女儿搞笑冷笑话

    爆笑经典差评冷笑话,淘宝差评:客服服务态度挺好,快递也很快,一定觉得我会给你好评吧,错了,我要给你差评,人生,很多时候就是这样不可思议!糗事女儿搞笑冷笑话,我想买件夹克,结果对着形形色色的品牌拿不定主意。”两口子在吵架,三岁的女儿不知什么时候从房间出来,直愣愣地盯着爸爸妈妈看。乃大妈自己含着棒棒糖,哄正太“别哭,再哭不让你看我吃了”!

    2022年10月18日
    39000

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注