监测分析、异常监测、广告验证、访客唯一标识
知识图谱标签:第三方监测、在线广告行业、JavaScript(前端/全栈)技术
Web客户端追踪(下)—浏览器指纹追踪:比较全面,覆盖了浏览器指纹追踪、跨浏览器指纹和 WebRTC 等
决策行为 | 主动行为 | 半主动行为 | 被动行为 |
---|---|---|---|
转化(conversion)和预转化(pre-conversion) | 广告点击(ad click)、搜索(search)和搜索点击(search click) | 分享(share)和网页浏览(page view) | 广告浏览(ad view) |
个人的一些思考:基于 CNN 的 Web 智能分析
说明 | |
---|---|
采集器 | 爬虫主动采集、JS SDK 被动采集 |
识别、截图服务 | 截图的技术,可参见《云商业智能(Cloud BI)》的“截屏”部分 |
计算机视觉智能分析 | 主要使用计算机视觉 CNN 技术 |
授权内容主要包括:账号、密码、有效期和频率等
类库 | 说明 |
---|---|
Fathom | 提取网页中有意义内容的 JavaScript 框架 |
关键词:深度卷积神经网络
图谱步骤: 图片归一化:灰度值 = RGB各值的和 / 3
计算梯度:
舍掉局部信息:
报告 | 参考技术 |
---|---|
色彩趋势 | 可用 node-vibrant 提取出图片的主要颜色和百分比,分析出图片的主色调 |
图关键词 | 可调用 clarifai 或同类图像识别 api,标记出内容,自动识别图片的内容,作为图片的关键词 |
https://github.com/TingGe/web-analytics/issues
https://github.com/TingGe/web-analytics/graphs/contributors
(The MIT License)
Copyright (c) Ting Ge [email protected]