一篇文章讲清ASO优化“组词”技术


Warning: Invalid argument supplied for foreach() in /data/cxweb/www/gupowang.com/public/article/view.html on line 71
4年前

 

t01ba2e11a7fffacfd4.jpg

来源|鸟哥笔记  ID:niaoge8

作者|appbk@刘新鸣

 

所谓“组词”,就是把一些具有“共同部分”的词组合到一起,如App的关键词包含“腾讯新闻”和“网易新闻”这两个词,就可以组合成“腾讯网易新闻”,而用户搜索时,搜索“腾讯新闻”或“网易新闻”也还是能搜到该App的。

 

之所有“组词”的需求,主要是由于Appstore对填写的关键词长度有限制(不得大于100个字符),而我们需要填写的关键词串经常大于100字符,因此需要对填写的一堆词进行组词,对可以合并的词尽可能地进行合并,从而能在100字符内尽可能多地展示我们的app信息,增加app被搜索词命中的概率。

 

组词看似简单,但涉及搜索引擎的分词和检索的基础知识,如果对这些不清楚,就经常会产生如“支付宝”和“宝贝”能否组合成“支付宝贝”这样的疑惑。因此,本文就首先简要介绍下分词和搜索的基本知识,然后再讲下appbk的自动组词方法。

 

 

分词技术

 

 

 

现代搜索引擎,都是以“词”为基础单位进行设计的。词是最小的有意义的语言成分。英语等字母语言,其单词天然按照空格隔开,但中文等东亚语种,其词之间并没有明显的分隔符,因此就产生了“分词”的需求。“分词”就是把一个汉语字符串分成一个个词的过程。

 

分词的例子如“腾讯新闻”的分词为:“腾讯 | 新闻”,“网易新闻” 的为“网易 | 新闻”。

 

由于中文分词经常会有“歧义”现象,如“兵乓球拍卖完了”可切分为“乒乓球 | 拍卖 |完了”又可以切分为“乒乓球拍| 卖 | 完了”,针对这种情况,搜索系统一般会把两种分词形式都记录下来,以供搜索时使用。

 

搜索的基础:词袋模型(word of bag)

 

 

“词袋模型”是搜索引擎中的一种简单假设,其不考虑词的“顺序”,认为一个文本就是

是一堆词的“集合”。也就是如两个文本“腾讯新闻”、“新闻腾讯”,对搜索引擎而言,是完全一样的。这种假设也是我们能够进行组词的基础。

 

我们还是以“腾讯新闻”和“新闻腾讯”,以及其组词“腾讯网易新闻”为例,其“词袋”模型如下图所示:

 

640.webp (5).jpg

 

图1 “腾讯新闻”和“新闻腾讯”,及其组词“腾讯网易新闻”的词袋模型

 

由于“词袋”模型是一个“集合”模型,可以不考虑重复元素,因此上面袋子中的两个“新闻”可以视为一个。从上图中可以看到,“腾讯新闻”+“新闻腾讯”,和“腾讯网易新闻”的词袋模型是完全等价的,也就是说对搜索引擎而言,他们是完全一样的。

 

然后,我们还可以利用上述模型,简单描述用户搜索的过程。搜索的时候,搜索系统首先会在对用户输入的搜索词进行分词,然后在关键词的“袋子”里面依次查找搜索词的分词。还是上面的例子,如用户搜索“腾讯新闻”时,流程如下图所示:

 

640.webp (6).jpg

 

图2 基于“词袋”模型的查找流程,搜索系统在“词袋”中分别查找“腾讯”和“新闻”这两个搜索词的分词

 

然后我们再看下“支付宝”和“宝贝”的例子 ,说明为啥他们不能组词。我们把“支付宝”和“宝贝”组成“支付宝贝”,但其分词的时候,可能会分成“支付 | 宝贝”,这种分词歧义就可能造成搜索“支付宝”的时候,搜不到该App,具体如下图所示:

 

640.webp (7).jpg

 

图3 关键词“支付宝”和“宝贝”组成“支付宝贝”后,由于可能的分词歧义,用户搜索“支付宝”时,可能会搜索不到该App。

 

 

 

组词方法

 

 

 

因为搜索系统是以“词”为基础单位进行检索的,因此,首先需要对关键词进行“分词”。然后就是具体的“组词”过程了。

 

“组词”就是一个分组的过程,我们利用的是机器学习中的“在线聚类”技术,其实就是把字符串中有相同子串的词组合在一起,然后不断循环,直到没有重合的词出现。组词过程中,我们考虑到苹果的规则,一个“词”不能过长,否则可能会被认为是关键词堆砌,因此,我们限制了组词的最大个数,就是最多组合5个词。

 

在appbk上有一个“组词工具”服务,具体见appbk.com网站的菜单导航栏。它的“推荐组词”结果设置了最大组词个数限制,以‘美女直播,yy视频,交友网站,明星直播’为例,其在上面的组词结果如下图所示:

 

640.webp (8).jpg

图4 appbk的组词服务

 

其中,‘美女直播’和明星直播两个词组合在了一起,省了两个字符和一个逗号的空间。

 

当然,这个组词工具还给出了不考虑组词长度的结果,就是“最大限度组词”的结果。

 

 

逗号问题

 

 

 

“最大限度组词”,其实已经把所有可能组合的词,都组到了一起,但还有用户经常会问,这样的组词还是有“逗号”存在,能不能干脆把全部的逗号都干掉,这样不是能加更多的词吗?

 

根据上述的“词袋”模型,即使把所有的逗号都干掉,其关键词的“词袋”是没有变化的,因此对搜索的影响不是很大。但考虑到下面的因素,并不建议这样做:

 

1、苹果规则限制。在2015年之前,很多ASO服务商给出的关键词建议都是没有任何逗号的,但这种情况多了后,苹果的关键词审核就会更严格,这样的形式会被认为是“关键词堆砌”,审核就不通过,因此,组词需要“适度”。

 

2、权重影响。根据“词袋”模型,用户搜索“腾讯新闻”时,关键词填写“腾讯新闻”或者“腾讯网易新闻”,是都能搜到的,这个是没有问题的。但是,关键词“腾讯新闻”与用户搜索词是完全一致的,这种情况,搜索引擎一般都会有少量的加分。

 

综合我们的一些实践经验,给出以下建议:

 

1、组词不宜过长,以不超过5个为宜。

2、对下载量较少的App,不需要刻意的组词,因为你的App基本处在长尾位置,一点点的加分,就可能让你的搜索排名有大幅提升。

3、对应需要“刷”的词,还有核心带量的关键词,建议都用逗号隔开,不进行组词。

 

【相关推荐】

 

揭秘ASM(二):苹果竞价广告后台设置步骤详解

紧急通知!苹果再次更新《App Store审核指南》,新增内容多达25处!

有哪些值得一试的APP推广小技巧?

这些坑你要避开,从ASO的角度看iPhone7发布会 

iOS搜索竞价广告(一):基础篇,揭秘ASM

史上最全App推广渠道(包含8个方向37个方法)

 

婆那些事儿推广服务 点击 :http://www.gupowang.com/news/4585.html

大家都爱搜:ASM 互联网资讯类类有话说App推广运营经验线下推广活动推荐微信营销姑婆专题姑婆圈ASO校园推广地推ASO100渠道刷量校园运营团队

姑婆那些事儿(www.gupowang.com)是互联网推广运营知识分享平台,关注移动推广(android,ios)运营,网站推广运营、校园推广及互联网领域最新动态 。欢迎关注我们的微信(gupo520),新浪微博(姑婆那些事儿)。

版权声明:本文来源于互联网,仅作分享学习之用,姑婆那些事儿负责整理推荐。文章仅代表原作者独立观点,不代表本平台运营者观点与立场。如有版权问题,请联系姑婆那些事儿—小秘书(微信号:gpxms001)协商解决 。

 

App Store ASO优质渠道推荐:

A、业务描述

App Store搜索结果排名即App Store ASO。让您的关键词在App Store排名靠前。

B、优势。

1、高效。上排名速度快。

2、价格优势。市场低价。

3、服务好。定期的投放报告以及策略,让您安心,省事。

C、相关链接

http://www.gupowang.com/zhuanti/3964.html

D、联系方式

662923092834834966.jpg

姑婆那些事儿2013年开始研究ASO,最近在重新整理相关知识(本月整理为文档,电子书),也可以为大家免费答疑,欢迎大家加下善小玉微信,一起交流讨论。

收藏

{{favCount}}

个人收藏

投稿请戳这里!投稿
0

次分享

文章评论(0)

{{ user.nickname }}
发表评论
登录 进行评论
加载更多 正在加载中... 没有更多了