所述分类算法构建模型所用的数据称为训练数据,是所属类别已知的多个互联网 网站经过第1步处理后的最终文本集。例如构建经营性网站模型的时候,选择公司类、网上 大卖场类、收费的俱乐部类的网站的最终文本集作为训练数据。构建非经营性网站模型的 时候,选择部门网站、学校类、社会公益类的网站的最终文本集作为训练数据。
霍州市网站信息发布推广公司【发布猫云媒体】
可根据多种分类算法构建各自的模型。当采用svm算法时,可首先构建公司类网 站和非公司类网站模型,然后用非公司类网站再构建学校类网站和非学校类网站的模型, 以此类推,最终得到多个类别模型。这是由于svm算法虽然分类准确率较高,但具有一定的 局限性,每次只能分成两个类别。当采用bayes算法时,其一次可构建多个类别的模型,可 分别选取公司类网站、网上大卖场类网站等具有代表性的网站的最终文本集, 对这些最终文本集用bayes算法同时构建多个类别模型。
霍州市网站信息发布推广公司【发布猫云媒体】
所述特殊规则匹配算法归纳的规则例如是:网站一定为非经营性网站,从 而可以得出url中含有gov. "的网页一定是非经营性网站,为此建立一条规则。
第3步,以所选择分类算法和特殊规则匹配算法,并以分类算法中的一种或多种, 例如svm算法、bayes算法、随机森林(random forest)算法等,对待分类文本的最终文本集 各自独立地进行分类,并将分类的结果存入结果库。
第 4步,如果一个互联网网站的最终文本集用多种算法分类的结果都属于公司类 网站,则可以确定该最终文本集对应的网站一定为经营性网站。如果一个互联网网站的最 终文本集用多种算法的分类结果不一样,则有两种处理方式:一种是区分各类算法的权重 并由此判断分类结果的权重,采纳权重较大的分类结果;另一种最终由人工判定。
霍州市网站信息发布推广公司【发布猫云媒体】
确定第一窗口长度,第一滚动距离为当前时刻推广信息所在页面的横向滚动条,从推广信息所在页面的左端向右端滚动的距离;[基于坐标中的纵向坐标和第二滚动距离,确定第一窗口宽度,第二滚动距离为当前时刻推广信息所在页面的纵向滚动条,从推广信息所在页面的顶端向底端滚动的距离;[将第一窗口长度与第一窗口宽度进行相乘,得到第一窗口尺寸。[在本公开实施例中,当终端接收到网络视频播放指令时,播放该网络视频中投放的推广信息,之后,终端确定该推广信息被用户观看的推广信息观看结果,使根据该推广信息观看结果确定推广信息观看次数。由于推广信息被用户观看之后,才起到推广信息的推广作用,所以,通过推广信息观看次数确定推广信息投放的有效性。
霍州市网站信息发布推广公司【发布猫云媒体】
确定纵向坐标小于第二滚动距离,计算第二滚动距离与纵向坐标之间的第二差值为,再计算推广信息所在页面的播放窗口的宽度与第二差值之间的差值,得到第一窗口宽度为。[()、如果当前显示的网页页面的可视窗口中不包含推广信息的播放窗口,则确定推广信息观看结果为未观看。[如果当前显示的网页页面的可视窗口中不包含推广信息的播放窗口,确定推广信息的播放窗口为滚动到可视窗口之外,因此,确定推广信息观看结果为未观看。[()、如果当前显示的网页页面的可视窗口中包含推广信息的播放窗口,则判断在当前显示的网页页面的可视窗口中是否检测到指定操作。[如果当前显示的网页页面的可视窗口中包含推广信息的播放窗口,由于用户是否在终端跟前不确定。
霍州市网站信息发布推广公司【发布猫云媒体】
确定所述推广信息观看次数。.如权利要求所述的方法,其特征在于,所述基于所述推广信息标识和所述推广信息观看结果,确定所述推广信息的已观看统计次数、未观看统计次数和待定统计次数,包括:基于所述推广信息标识和所述推广信息观看结果,从存储的推广信息标识、推广信息观看结果与统计次数之间的对应关系中,获取对应的统计次数;增加获取的统计次数;基于所述推广信息标识,从增加所述统计次数之后的所述推广信息标识、推广信息观看结果与统计次数之间的对应关系中,获取所述已观看统计次数、未观看统计次数和待定统计次数。.如权利要求所述的方法,其特征在于,所述基于所述已观看统计次数和所述待定统计次数,确定所述推广信息观看次数,包括:将所述待定统计次数与第二比例阈值进行相乘。