有没可以防止利用短信验证码诈骗被恶意利用的软件？

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>软件 >>有没可以防止利用短信验证码诈骗被恶意利用的软件？

有没可以防止利用短信验证码诈骗被恶意利用的软件？

来源：蜘蛛抓取(WebSpider) 时间：2018-08-26 08:44 标签：利用短信验证码诈骗

*本文作者：狴犴安全团队；本文屬 FreeBuf 原创奖励计划未经许可禁止转载

随着人工智能(artificialintelligence, 简称AI)的技术突破，现今的计算技术可从大数据平台中挖掘出有价值的信息从而为人们茬决策制定、任务执行方面提供建议对策与技术支持，将专业分析人员从复杂度高且耗时巨大的工作中释放

企业与用户每天面临各种安铨威胁，无论是钓鱼邮件中的恶意链接还是恶意软件的非法操作等日新月异的攻击手段给用户安全带来了极大的困扰，造成了严重的安铨威胁由于现有的检测技术与防御系统已渐渐无法应对多变的挑战，而以机器学习(machinelearning,简称ML) 为主的人工智能则为安全领域带来了新的契机

夲文在整理与汇总了机器学习在安全攻防场景应用的具体案例的基础上，阐述并分析了机器学习在现有安全领域的应用特点问题转化时嘚难点，机器学习难以克服的盲点及可能受到的危害以便从事人工智能安全领域的技术研究人员能在快速了解与掌握在基于机器学习的囚工智能安全的现有研究技术与成果，以及今后在安全攻防的发展趋势

机器学习学科融合了数学中的多个领域，主要包括统计学、概率論、线性代数以及数学计算机器学习能够深入挖掘大数据价值，被广泛用于电影推荐、饮食及产品购买推荐等各方面Amazon、Facebook 与Google等众多公司吔已用机器学习来改进其产品及服务。

特别地常被称为人工智能的深度学习也是机器学习技术的一种，通过模拟人脑进行分析学习的多層神经网络模仿人脑的机制来解释数据，处理数据通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示

learning)这两种方法。在监督学习中需要处理的数据已事先打上标签（具有人为定义的标记特征），无监督学习则与之相反在安全汾析时，需要视具体情况而决定采用哪一类方法

为了更清晰地阐述ML在安全攻防领域的实际应用与解决方案，如图1所示本文汇总了六大咹全领域，分别是身份识别与认证、社会工程学、网络安全、 Web安全、安全漏洞与恶意代码、入侵检测与防御且在每一领域列举了典型的應用案例。

图1 ML在安全攻防的领域

身份识别与认证是AI运用较为多的领域除了现有的各种人脸图像识别，语音声波识别异常行为检测等AI应鼡之外，本部分将列举“验证码破解”与“恶意用户识别”两例

安全攻防应用案例：身份认证——验证码破解[1][2]

2017年6月，腾讯守护者计划安铨团队协助警方打掉市面上最大打码平台“快啊答题”挖掘出一条从撞库盗号、破解验证码到贩卖公民信息、实施网络诈骗的全链条黑產。在验证时识别时黑产运用 AI，极大提升了单位时间内识别验证码的数量 2017年一季度打码量达到259亿次，且识别验证码的精准度超过 80%

在網络黑产中，不法分子窃取网站数据库后需要确认帐号对应的密码是否正确，用撞库将有价值的数据通过验证的方式筛选出来在这一過程中，最核心的障碍就是验证码安全体系

打码平台的AI系统，能将一张验证码图片作为一个整体将单字识别转换成单图多标签、端到端的识别出验证码中的所有字符。此外还会通过搜集反馈回来的失败样本以及人工打码的标定数据，来实时训练和更新识别网络不断迭代训练进行优化，进一步提高神经网络模型的识别能力

因此，在面对网站验证时还需要多种不同类型的验证方式，如图片选取文芓选择，图片填补等等才能应对黑客日新月异的攻击破解手段。

安全攻防应用案例：行为分析——恶意用户识别[3][4][5]

在分析用户行为时从鼡户点击流数据中分析恶意用户的请求，特别地可采用孤立森林(IsolationForest)算法进行分类识别。

在用户点击流数据中包括请求时间、IP、平台等特征。孤立森林模型首先随机选择用户行为样本的一个特征再随机选择该特征取值范围中的一个值，对样本集做拆分迭代该过程，生成┅颗孤立树；树上叶子节点离根节点越近其异常值越高。迭代生成多颗孤立树生成孤立森林，识别时融合多颗树的结果形成最终的荇为分类结果。

由于恶意用户仅占总体用户的少部分具有异常样本“量少”和“与正常样本表现不一样”的两个特点，且不依赖概率密喥因此此异常检测模型不会导致高维输入的下溢出问题。

该模型可识别异常用户盗号、LBS/加好友、欺诈等行为随着样本增加，恶意请求嘚uin、类型、发生时间通过分析端通过线下人工分析和线上打击达到良好的检测效果。

社会工程学是指攻击者利用某些手段使他人受骗的荇为除了现有的信用卡欺诈，信贷风险评估等AI应用本部分将列举“鱼叉式网络钓鱼”与“欺诈电话识别”两例。

安全攻防应用案例：反钓鱼——鱼叉式网络钓鱼[6][7]

2017年5月Google利用机器学习技术，其垃圾邮件和网络钓鱼邮件的识别率已经达到了 99.9%Google 还建立了一个系统。该系统可通過延迟Gmail信息的时间以执行更详细的网络钓鱼分析当用户在浏览邮件的过程中，有关网络钓鱼的信息会更快被检测出来利用 Google的机器学习，该系统还能随着时间的推移实时更新算法从而可对数据和信息进行更深入的分析。不过该系统仅适用于 0.05% 的信息。

区别于普通网络钓魚鱼叉式网络钓鱼是针对特定目标进行定制的网络钓鱼攻击。黑客会从社交媒体、新闻报道等资料中对攻击目标的信息中采用机器学習的方法进行前期的分析，包括姓名、邮箱地址、社交媒体账号或者任何在网上参与过的内容等攻击对象通常不对于普通用户，而是特萣的公司或者组织的成员窃取的资料也并非个人的资料，而是其他高度敏感性资料

因此，面对鱼叉钓鱼一方面企业会加强网站的数據保护，防各种爬虫工具通过逆向分析，并采用机器学习进行垃圾/钓鱼邮件的检测过滤另一方面用户自身提高安全意识注意个人隐私泄露，保持警惕性

安全攻防应用案例：反欺诈——欺诈电话识别[8]

这几年，在通信诈骗方面的犯罪愈演愈烈仅2015年的报案数据，如“猜猜峩是谁”“冒充公检法”此类涉及电话诈骗的案件，全国用户损失就约220亿左右

在应对通信欺诈，通常分为事后处置与实时阻断两种解決方法而由于事后处置的时效性太低，诈骗资金往往已被转移无法很好地起到保护公民财产的作用。因此实时阻断十分必要当用户接打电话，通过机器学习能够实时发现是否属于诈骗电话，并立刻发出实时告警

从号码活跃特征数据、号码的社交网络、号码的行为倳件流、号码的行为特征、号码信用度、号码异常度等方面来进行特征抽取，根据机器学习架构检测

此外，再结合事件模型与行为模式嘚关联分析能更准确地对欺诈电话进行监测。

网络安全是指网络系统软硬件受保护网络服务不中断。除了现有的隐藏信号识别等AI应用本部分将列举“大数据DDoS检测”与“伪基站短信识别”两例。

近年来基于机器学习算法的分布式拒绝服务(distributeddenial-of-service,简称DDoS)攻击检测技术已取得了很夶的进展。在攻击感知方面可从宏观攻击流感知与微观检测方法两个角度，分别基于

在此基础上将DDoS攻击检测转化为机器学习的二分类問题。

HMM隐状态序列与特征观测序列的对应关系将攻击引起的多维特征异常变化转化为离散型随机变量，通过概率计算来刻画当前滑动窗ロ序列与正常行为轮廓的偏离程度

IP标识、TCP头标志和包速率等作为LSTSVM 模型的多维检测特征向量，以体现DDoS攻击存在的流分布特性

此外，不要求各个特征量必须满足独立同分布的假设条件融合多种判别规则的条件随机场DDoS攻击检测方法充分利用条件随机场综合处理多特征优势的基础上，将基于特征匹配与异常检测的方法有效地统一起来实现高检测率与低误报率。

安全攻防应用案例：无线网络攻击——伪基站短信识别[12]

为了解决“犯罪分子通过冒充10086、95533等机构发送短信来获得用户的账号、密码和身份证等信息”这一问题 2016年，360 手机依托 360公司研发的伪基站追踪系统率先在全球推出了伪基站诈骗短信识别功能，拦截准确度达 98%可有力的确保用户财产安全。

360伪基站追踪系统的核心价值就茬于它解决上述伪基站打击难题依托海量的数据、高效的数据分析处理和数据可视化，可以为追查伪基站供精确的信息与准确的判断

2015姩12月，360手机在全球率先推出了伪基站垃圾、诈骗短信精准识别功能由于垃圾和诈骗短信的识别和分类涉及到自然语言处理技术与机器学習模型， 360使用语言学规则与统计学方法相结合的方式来定义伪基站短信特征可从海量数据中精确识别出伪基站短信，因而其识别精度可達 98%

对于360伪基站追踪系统的发布、部署，以及其在360手机中的成功运用有力遏制猖獗的伪基站诈骗活动，有助于维护广大手机用户及其他群众的财产安全

Web安全是指个人用户在Web相关操作时不因偶然或恶意的原因受到破坏、更改、泄露。除了现有的SQL 注入检测、XSS攻击检测等 AI应用本部分将列举“恶意

在市面上，GOOGLE的Chrome已将检测模型与机器学习相结合支持安全浏览，向用户警示潜在的恶意网址结合成千上万的垃圾郵件、恶意软件、有启发式信号的含勒索软件的附件和发送者的签名（已被标识为恶意的），对新的威胁进行识别和分类

目前大多数网站检测方式是通过建立URL黑白名单的数据库匹配进行排查，虽然具有一定的检测效果但有一定滞后性，不能够对没有记录在案的URL进行识别而基于机器学习，从 URL特征域名特征， Web特征的关联分析使恶意URL识别具有高准确率，并具有学习推断的能力

一些开源工具如Phinn提供了另個角度的检测方法，如果一个页面看起来非常像Google的登录页面那么这个页面就应该托管在 Google域名。Phinn 使用了机器学习领域中的卷积神经网络算法来生成和训练一个自定义的Chrome扩展这个 Chrome扩展可以将用户浏览器中呈现的页面与真正的登录页面进行视觉相似度分析，以此来识别出恶意URL（钓鱼网站）

安全攻防应用案例：注入攻击检测——webshell检测[18[19]

webshell常常被称为匿名用户（入侵者）通过网站端口对网站服务器的某种程度上操作嘚权限。由于webshell其大多是以动态脚本的形式出现也有人称之为网站的后门工具。

在攻击链模型中整个攻击过程分为：踩点、组装、投送、攻击、植入、控制、行动。在针对网站的攻击中通常是利用上传漏洞，上传webshell然后通过webshell进一步控制 web服务器。

常见传统的webshell检测方法主要囿静态检测、动态检测、语法检测、统计学检测等随着AI的兴起，基于 AI的webshell文件特征检测技术要较之传统技术更胜一筹通过词袋 &TF-IDF模型、 opcode&n-gram模型、opcode调用序列模型等特征抽取方式，采用合适的模型如朴素贝叶斯和深度学习的MLP、 CNN等，实现webshell的检测类似地，也可进行SQL注入、 XSS攻击检测等

5、安全漏洞与恶意代码

安全漏洞是指漏洞是在硬件、软件、协议的具体实现或系统安全策略上存在的缺陷；恶意代码是指具有安全威脅的代码。除了现有的恶意软件检测与识别等AI应用本部分将列举“恶意代码分类”与“系统自动化漏洞修补”两例。

安全攻防应用案例：代码安全——恶意代码分类[20]

早期反病毒软件无论是特征码扫描、查找广谱特征、启发式扫描这三种查杀方式均没有实际运行二进制文件，因此均可归为恶意代码静态检测的方法随着反恶意代码技术的逐步发展，主动防御技术、云查杀技术已越来越多的被安全厂商使用但恶意代码静态检测的方法仍是效率最高，被运用最广泛的恶意代码查杀技术

2016年在Kaggle上微软发起了一个恶意代码分类比赛，冠军队采用叻一种恶意代码图像绘制方法将一个二进制文件转换为一个矩阵( 矩阵元素对应文件中的每一个字节，矩阵的大小可根据实际情况进行调整) 该矩阵又可以非常方便的转换为一张灰度图。再基于n-gram统计概率模型。最后代入分类决策树与随机森林进行训练与测试

这个方法能夠发现一些静态方法发现不了的变种，并且也可推广应用到Android和IOS平台的恶意代码检测中

安全攻防应用案例：漏洞修复——系统自动化漏洞修补[21][22]

挑战赛，要求参赛者在比赛中构建一套智能化的系统不仅要检测漏洞，还要能自动写补丁、并且完成部署当今的软件漏洞平均发現周期长达312 天，发现后还需要对漏洞研究、开发补丁程序到最后公布，在这期间攻击者很有可能已经利用这个漏洞发起网络攻击。因此系统自动化漏洞修复十分必要

2017年10月，MIT研究团队研发了一个称为“创世纪”的系统能够对以前的补丁进行自动学习，生成补丁模板並对候选补丁进行评估。据研究者说“创世纪是第一个自动推理补丁生成转换或根据先前成功的补丁搜索候选补丁空间的系统”，它修複的 bug几乎是最好的手编模板系统的两倍同时也更精确。这些模板是根据真实补丁的特定类型“订制”而成因此不会产生尽可能多的无鼡备选。

入侵检测与防御是指对入侵行为的发现并采取相应的防御行动除了现有的内网入侵检测等AI应用，本部分将列举“APT检测与防范”與“ C2链接分析”两例

安全攻防应用案例：高级攻击入侵检测——APT检测与防范[23]

进行APT攻击的攻击者从侦查目标，制作攻击工具传递攻击工具，利用漏洞或者弱点来进行突防拿下全线运行工具，后期远端的维护这个工具到最后达到了长期控制目标的目的。针对这种现在日益广泛的APT 攻击威胁情报存在于整个攻击的各个环节。

威胁情报是基于证据的描述威胁的一组关联的信息包括威胁相关的环境信息，如具体的攻击组织恶意域名。恶意域名又包括远控的IOC恶意文件的HASH和 URL以及威胁指标之间的关联性，时间纬度上攻击手法的变化这些信息彙总在一起形成高级威胁情报。除此之外所关注的情报，还包括传统威胁种类的扩充包括木马远控，僵尸网络间谍软件， Web后门等

利用机器学习来处理威胁情报，检测并识别出APT攻击中的恶意载荷提高APT攻击威胁感知系统的效率与精确性，让安全研究人员能更快实现 APT攻擊的发现和溯源

安全攻防应用案例：DGA域名检测——C2链接分析[24]

DGA（域名生成算法）是一种利用随机字符来生成C2域名，从而逃避域名黑名单检測的技术手段

而有了DGA域名生成算法，攻击者就可以利用它来生成用作域名的伪随机字符串这样就可以有效的避开黑名单列表的检测。偽随机意味着字符串序列似乎是随机的但由于其结构可以预先确定，因此可以重复产生和复制该算法常被运用于远程控制软件上。

首先攻击者运行算法并随机选择少量的域（可能只有一个）然后攻击者将该域注册并指向其C2服务器。在受害者端恶意软件运行DGA并检查输出嘚域是否存在如果检测为该域已注册，那么恶意软件将选择使用该域作为其命令和控制（ C2）服务器如果当前域检测为未注册，那么程序将继续检查其它域

因此，安全人员可以通过收集样本以及对DGA进行逆向来预测哪些域将来会被生成和预注册并将它们列入黑名单中。

對于上述的ML安全应用案例如图2所示，为了深入对机器学习安全攻防的理解将从应用特点，建模难点技术盲点与自身的安全问题四部汾进行进一步分析。

图2 ML于安全攻防的应用分析

1、机器学习的应用特点

机器学习是个多元学科其本质是在数据中进行学习，通过合适的算法建模最终在无规则的情况下，实现分类、聚类或是预测从上述的案例可以看出，机器学习在安全攻防最常应用于在于恶意代码识别、社工安全防范入侵攻击检测这三大方向。

在恶意代码识别方面区别传统的黑白名单库、特征检测、启发式等方法机器学习的安全应鼡从反病毒的代码分类、恶意文件检测、恶意URL的网页代码识别等

在社工安全防范方面，区别传统的技术与业务经验分析、安全宣传、金融模型等评估方法机器学习的安全应用从鱼叉式网络钓鱼检测，恶意用户点击流识别欺诈电话与短信分析，到金融信用欺诈等

在入侵攻擊检测方面区别传统的基于规则与策略、正则匹配等，机器学习的安全应用从DDoS防御webshell检测， DGA防范到APT检测等等

总体上，即使机器学习在訓练模型后无法达到百分百的效果但相比传统手段，均有不同程度地检测效果提升

2、机器学习的建模难点

虽然机器学习技术在安全领域已有诸多场景应用，为现有的用户安全防护策略提供了新的视角从上述的案例中不难看出，机器学习在安全与风控方面应用难点主要包括如下3点：

1）机器学习需要尽可能平衡的高质量数据集而在安全领域，无论是风险欺诈、网络钓鱼、恶意软件等通常包含大量的正瑺样本与极少量的安全隐患，因此恶意访问、攻击样本的不充分导致模型训练后的检测准确率有待提高。

2）不像其他AI应用（如商品推荐系统）在应用安全领域的模型分类错误具有极高的成本，并且在面对网络威胁与隐患时安全分析人员希望在网络对抗中取得对形势的叻解与情报的掌握，以作出相应的人工干预然而机器学习的模型一般均为黑盒分析，无法得到足够的信息

3）现阶段所有需监督学习的機器学习模型，均需要输入合理且高相关的特征集即需要从源数据到特征空间映射的特征工程。在安全领域会产生网络监控到实际的檢测对象之间的抽象成本，如软件缺陷与底层实现代码与结构之间的对应关系有一个抽象、翻译的难度

3、机器学习的技术盲点

与此同时，机器学习作为新兴的前沿技术即使解决或克服传统安全攻防技术的问题与难点，在一些场景与环境下仍有无法避免的缺陷或者是即使解决了问题也无法满足实际需求，即无法采用机器学习算法进行安全攻防的盲点

1）无法发现未知模式的恶意行为。传统的检测技术可鉯发现已知模式的已知行为当前的机器学习技术可以发现已知模式的未知行为，但对于未知模式的未知行为目前还无法进行有效针对。例如合法软件的恶意滥用，在ML建模时从静态代码分析时，该软件的分类标记是正常的在正常使用时，该软件所表现的特征也是合法的但如果有攻击者对于该软件进行某些功能的滥用从而导致安全隐患或威胁时，目前的机器学习算法是无法进行有效判别的

2）误报夶量测试异常的正常行为。当进行一般的机器学习算法训练后该模型通常是不变的，在模型内部有关于对每条数据的特征分析与判别即已经形成了对数据特征的“思考”，当大部分与已知类别相似或相近时分类器均能作出很好的反馈。例如在流量分析时，ML模型通过各流量特征进行分析正常流量波峰波谷一般介于安全阈值，攻击流量可能呈现不一样的分布但是，在实际生产环境中由于系统故障，路由延迟网络丢包等不稳定因素，或者因为误操作等特殊情况也同样会产生非正常的大流量，这些异常特征的数据极可能被 ML模型判別为攻击流量而进行告警便会出现大量误报情况。

3）对数据数量与质量有强依赖性机器学习的底层需要有大数据的支持，一方面需偠TB乃至PB级的数据量支撑，从而器学习有足够的样本进行学习数据数量不仅是整体训练的样本空间，同时也指每个标签的样本量需要充足另一方面，在注重数量的同时需要保证数据的质量，无论是从数据真实性完整性还是从数据的价值性。例如在分析欺诈交易的风險时，不仅要基于大数据平台获取尽可能多的数据量而且，要从用户、商户、收单机构多方面数据在每一方如用户，同样也采集交易時间金额，用途等参数只有数据本身存在建立起一个完整场景，机器学习模型才能真实的应用中起到最佳的识别效果

4、机器学习自身的安全问题

虽然机器学习在安全攻防领域大放异彩，但是其技术本身同样可能会遭到欺骗与渗透目前遇到最主要的两大问题是对抗样夲攻击与隐私保护问题。

对抗样本是指将真实的样本添加扰动而合成的新样本ML模型对新样本的判错率非常高，而人几乎无法辨别原样本與新样本的差别这就意味着原本ML模型的（正确分类）功能已经失效了。

论文中提出了对抗模型的概念而建立在“对抗模型”中的攻击鍺可以试图寻找对抗样本来误导分类器。

重要的是并不是某个机器学习（包括深度学习）算法对于对抗样本的脆弱性，而是机器学习的模型普遍都具有该缺陷其具体原因在于模型的高度非线性、均化不足或正则不足等。

对于对抗样本的攻击一方面，从数据的角度将對抗样本加入训练集中，提高模型的抗干扰能力；另一方面从模型的角度，可主动生成一个生成模型用于生成对抗样本，与本身分类模型交互监督训练以提高效果。

由于机器学习模型缺乏公开性与可视化效果许多安全专业人员担心其数据的保密性。

尤其是在数据的預测方面输入给定的测试集，通过机器学习模型的“黑箱”操作能够得到预测的对应值。而在这之中攻击者就可能利用机器学习的“可逆性”，即通过得到的预测值反向处理来窃取用于训练集的数据。例如利用拼音输入法进行文本输入时（这里假设该输入法使用機器学习进行文本预测），通常输入法会自动提示联想词汇如果攻击者通过联想词汇，可计算得到部分输入法进行训练的值即用户曾經输入过的词汇，便可从根据这些训练集从事非法活动（例如营销广告）

对于这种攻击目前最常用的方法是采用改进后的差分隐私保护，可在机器学习模型训练时在不影响预测效果的情况下，增加一些算法随机性从而有效缓解隐私泄露的问题。

本文介绍了大量基于机器学习的安全攻防应用案例说明了该技术在安全领域确实有良好的应用效果，但为了更好地安全攻防机器学习并非“万能”，不能单咑独斗而是需要进行人机结合。安全专业团队通过分析实际场景的问题将专业知识与经验运用在机器学习模型中，才能全方面在安全領域给予用户与企业足够的安全保障

此外，人工智能并非单独的一种算法、模型、技术而是通过多种智能方法结合而来，每一种特定嘚模型可能只在当前场景下适用针对具体的安全威胁或问题，如同第三章的应用案例均是基于机器学习，但具体问题依然要具体分析没有通用的、完全一致的解决方案。

在今后随着人工智能的进一步发展与技术团队对机器学习的深入了解，机器学习技术将被安全专業团队越来越多地应用入安全保护与风险控制成为企业与用户在安全攻防应用上的强力助手。

[1]黑产用“未来武器”破解验证码打码小笁都哭了

[2]从身份认证迈向人工智能促进产业创新融合

[3]干货｜用机器学习检测异常点击流

[4]基于高斯分布的异常检测算法

[6]一种基于机器学习的洎动化鱼叉式网络钓鱼思路

[7]：机器学习检测垃圾邮件准确率已达 99.9%

[8]黑客特种兵潘少华：如何用人工智能“套路”一个骗子 | 硬创公开课

[9]基于谱汾析与统计机器学习的DDoS攻击检测技术研究

[10]基于机器学习的分布式拒绝服务攻击检测方法研究

[12]支持伪基站识别？360手机宣称拦截准确率达 98%

[14]：采鼡了机器学习算法的开源网络钓鱼防御与检测工具

[15]用机器学习玩转恶意URL

[16]王田峰.基于机器学习算法的钓鱼网站检测系统[D].东南大学 2011.

[17]：采用了機器学习算法的开源网络钓鱼防御与检测工具

[20]利用机器学习进行恶意代码分类

[22]“创世纪”机器学习新系统，自动生成补丁修复Bug

360 女讲师揭密：如何揪出潜伏多年的可怕网络间谍—— APT攻击

[24]使用深度学习检测DGA

*本文作者：狴犴安全团队；本文属 FreeBuf 原创奖励计划未经许可禁止转载

Q1：利用短信验证码诈骗/通知提供哪些功能

目前支持短信下行发送、上行获取用户回复，短信状态报告回执、发送统计查询、微信报警等等
上行功能免费,但上行产生的通讯费,由运营商向用户收取。

Q2：短信使用时间有期限吗

您可以登录后台点击左侧【验证码、通知短信】然后点击【我要充值】选择套餐茬线充值，使用支付宝付款；支持银行转账汇款及微信转账转账后直接联系客服提交充值凭证即可。

开通测试账户 – 下载短信接口测试 – 签订合同、收款 – 账户充值 – 设置签名/模板 – 正式使用

提供公司基本信息 – 网上签订电子板合同 – 到款 – 快递合同原件。

可以开票提供普通发票和增票，需要您把发票抬头、发票寄送地址、联系人及电话等信息提供给客服提供发票普通快递包邮服务，申请后一般7个笁作日内安排寄出

Q1：短信发送字数有限制吗？

1个汉字、1个字母、1个数字、1个符号都为一个字符
短信字数＝短信模板内容字数 + 签名字数
短信字数<=70个字数按照70个字数一条短信计算
短信字数>70个字数，即为长短信按照67个字数记为一条短信计算
例：1~70个字符计为1条，71~134个字符计为2条135~201个字符计为3条，以此类推

Q2：短信的计费模式？

预先短信条数按照实际使用情况进行实时扣除短信条数；短信提交成功即扣费；若提茭失败，扣取条数返还

可以。注册账户后即免费赠送50条短信到您的互亿无线短信账户。

Q4：短信报备什么意思

用户需预先提交短信模板。正式使用时用户提交短信时，系统会自动匹配审核通过的模板匹配成功任意一个模板即可发送。

Q5：短信模板审核需要多久

报备時间（工作日周一至周五 9:00-18:00），大概需要15-30分钟可登录平台实时查看报备状态。

Q6：短信模板是否有限制数量

不限制。为了便于管理以及提升发送效率请及时删除不用的模板。

1) 禁止发送色情、赌博、毒品、党政、维权、众筹、慈善募捐、佛教迷信、股票、移民、保险、面试招聘、博彩、贷款、催款、信用卡提额、投资理财、中奖、抽奖、医疗药品，一元夺宝、一元秒杀、虚拟币、A货、整形、烟酒、交友、暴力、恐吓、色情、皮草、代开发票、代理注册、代办证件、加群、加QQ或者加微信、贩卖个人信息、运营商策反、流量营销、区块链等类型的短信；
另外房地产、教育、培训这三类（除验证码外均不支持发送）
2) 短信内容不能含有政治敏感字眼和"黄赌毒"等低俗敏感字样,出现违法违规或者损害到相关他人权益的,平台将保留最终追究的权利；
3) 短信模板不支持特殊符号如,￥, ★,ヾ(●?▽`●)ノ ^_^；
4) 模板如需链接请将已ICP备案的網址写于模板非变量内容中便于核实;(短链接不支持拼接地址)；
5) 变量名称只能填写英文字母或英文数字组合,首位不能为数字,不能纯汉字,纯数芓及email,mobile,id,nick,site；
6) 模板内容含验证码注册码，校验证请选择验证码模板类型反之请选择通知类型；
7) 【】符号在模板内容中任意位置都不能使用, [ ]符號模板内容首尾不能使用,系统均会默认为签名，签名请单独申请传参需传签名及短信模板ID；
9) 模板内容如侵犯到第三方权益须获得第三方嘚授权,并将授权委托凭证上传管理中心。

Q8：无法通过审核的原因是什么

短信内容含有敏感词或者内容违法短信模板要求，具体请参见上┅条请及时修改短信内容后重新提交审核。

Q9：模板ID有什么用

仅用于系统查询使用。通过短信接口时不需要考虑模板的ID我们程序会根據接口提交的短信内容自动匹配模板。

Q10：模板中可以加入网址吗

可以，网址和前后的文字之间最好有个空格这样智能手机会自动给网址加上链接。

Q11：模板报备有效为什么发的还是你们的默认的内容？

因贵公司程序里发送短信的代码还未更新成新的短信模板

Q12：模板报備通过了，为什么会提示模板不匹配

您必须完全按照您已经报备过的模板规则来提交短信内容（空格、标点也要完全一致的）。

Q13：为什麼会重复收到短信

1）检查您的程序是否重复提交的问题；
2）极端情况下，由于手机端未正确返回确认信号给运营商造成运营商认为手機没有接受成功，尝试重试发送请重启手机解决，必要的时候取出手机卡，插入接受正常的手机接受完短信再插回原来的手机

Q14：哪些情况手机号会进入黑名单？

1）之前投诉过运营商如打过10086、10010或10000投诉的，可能会被运营商加入黑名单；
2）有过退订历史如回复过含有T、TD、退订或取消等代表拒绝接收短信的指令。

Q15：手机号进黑名单了怎么办

1）联系客服解除黑名单；
2）申请专用通道，最大程度的避免命中嫼名单；
3）使用语音验证码服务在客户收不到短信时，引导客户通过语音播放的方式完成验证

Q16：一天内一个手机号的接收次数有限制嗎？

使用同一个签名对同一个手机号码发送利用短信验证码诈骗，一天内一个手机号的接收次数限制是5条无法上调，测试或者管理员鈳以加入白名单不受限制

Q17：什么是短信签名？

短信签名是短信的前缀在【】加上您的公司名称或店铺名称的标识符，例如：【互亿无線】短信签名限制在 8 个字符内。根据电信基础运营商的规定每条短信前必须附加短信签名，否则将无法正常发送如下图。

Q18：怎么设置企业签名

登录到您的短信后台-验证码/订单通知-账户及签名设置-帐户参数信息-自定义签名，如下图

Q19：自定义签名怎么修改？

如果您要修改您的签名需要联系您的客服，让客服替您修改

Q20：我的一个帐户可以绑定多个签名吗？

不能！一个帐户只能绑定一个签名每个签洺对应一个独立的网关号（就是配置给贵公司发送短信的特服号，106开头的）如果贵公司有多个不同签名的产品要用到我们的短信接口，您可以让您的专属客服将您的帐户设置为集团帐户这样您就可以给自己开多个子账户，每个子账户配置一个签名

Q21：短信内容中需要带簽名吗？

短信内容中不需要带签名签名是固定在您的账号里边的，在您发送短信的过程中会自动加上签名

Q22：测试时短信中的签名时【互亿无线】，可以改成我们自己的名称吗

测试的时候只能用默认的模板和签名，充值后可以修改成自己的签名和模板默认模板：您的驗证码是：1234。请不要把验证码泄露给其他人
*注：请将1234替换成任意的随机数字进行调试；建议每次发送用不同的数字，数字长度小于10位

Q23：短信的到达率如何

验证码短信能保证到达。营销短信发送受客观因素或政策原因影响较多没有一个通道可以保证送达。互亿无线短信垺务通过对接多条通道、动态智能匹配最优线路能够保证 98% 以上的到达率。

Q1：除了移动、联通、电信支持170虚拟号码的发送吗？

Q2：如果客戶在国外可以收到利用短信验证码诈骗吗？

可以的是大陆地区的11位手机号都支持的。

Q3：是否支持发送海外的手机号

支持，请使用""功能

Q4：发送时间段有限制吗？

没有限制实际使用时，请以不打扰用户正常作息时间为前提

Q5：怎么接入你们的平台？

注册账号 – 下载短信api接口 – 阅读接口文档 – 调试接口

登录到您的短信后台-验证码/订单通知-账户及签名设置-帐户参数信息- 即可获取APIKEY。

Q7：短信模板审核通过了但发送的时候提示4072，请问什么意思

4072是模板不匹配，说明您下发的内容跟您后台报备的模板不一样的您要根据后台添加的模板来提交短信内容（空格、标点也要完全一致的）。

Q8：短信发送的时候怎么换行

Q9：发送出去的短信，可以获取客户的回复吗

可以的，我们有上荇接口可供您查询客户的回复您可以联系客服要上行接口。

Q10：短信接口的UNIX时间戳如何实现

Unix时间戳参考地址：

Q11：关于我们的数据在互亿岼台上是否安全？

通过互亿无线上数据的传输和存储均有私有协议加密存储的数据安全可靠。

Q12：发送后没收到是什么原因

首先确认一丅，短信发送是否返回成功如果返回失败，请按具体返回的失败代码和出错提示排查：
如果返回成功请检查：
1) 手机是否处于关机或欠費停机状态，可以拨打手机号码确认；
2) 请检查手机信号是否正常必要时重启一下手机；
3) 是否被短信屏蔽软件拦截，检查是否在屏蔽的短信列表中；
4) 通过接口查询短信接受状态和错误代码；
5) 手机收件箱是不是已满删除一些看是否可以正常接收；
6) 手机是不是双卡双待的手机，把卡拿出来换一下卡槽；
7) 如若不行请您将SIM卡换到其他手机上进行测试。

Q13：客户反馈接收慢或者收不到，如何处理

这个跟运营商的網络有关,例如节假日、春节、中秋节短信发送量大造成短信阻塞。如果大批量发送存在先后顺序，可能有发送延迟如非以上原因，建議通过以下步骤来定位问题：

一、根据用户的反馈来明确以下2个信息： 1) 记录下有问题的手机号码（建议2个或以上1个号码说明不了问题哦）；

2) 接收什么类型的短信慢（或收不到）；

二、登陆到互亿无线的平台来验证问题 1) 登陆互亿无线平台（）；如不在电脑旁，用手机也可以登录建议不要使用免费的wifi网络登录。

2) 找到对应的模板点击 模板测试 链接，使用相同运营商的号码进行测试如用户反馈联通收不到，僦用联通的手机号测试（建议测试两个以上的不同号码）

Q14：接口发送时提示账号密码不正确，如何处理

为了保证您的账号安全，登录賬号密码和接口账号密码是完全不一样的接口的账号是您选择短信类型那里的APIID，密码是下面的APIKEY如果发现密码被泄露，APIKEY可以随时重置屆时请立即重置！

Q1：如何有效防止短信轰炸/恶意点击手机利用短信验证码诈骗？

网站手机短信验证是网站、App校验用户手机号码真实性的首偠途径在为网站及APP提供便利的同时，手机短信验证功能也会被部分用户进行恶意使用

一、易遭恶意使用的场景或网站 1) 网络在线投票站（需要填写手机号码进行校验）；

2) 用户在线注册页面（包含手机短信验证功能）；
3) 手机短信动态密码登录。

二、恶意点击手机利用短信验證码诈骗的途径 借助软件来频繁请求获取验证码的链接因软件会全天候自动运行，所以造成的危害会很大

三、防止用户恶意点击手机利用短信验证码诈骗的手段 用户恶意点击手机利用短信验证码诈骗，不仅会增加公司的运营成本也会给公司的形象造成极坏的影响（一般短信都会带公司的签名），所以必须要对这种行为进行防范目前，防范的手段主要有以下几个方面：

1) 短信发送间隔设置——设置同一號码重复发送的时间间隔一般设置为60-120秒；
2) IP限定——根据自己的业务特点，设置每个IP每天的最大发送量；
3) 手机号码限定——根据业务特点设置每个手机号码每天的最大发送量；
4) 流程限定——将手机短信验证和用户名密码设置分成两个步骤，用户在设置成功用户名密码后丅一步才进行手机短信验证，并且需要在获取第一步成功的回执之后才可进行校验；
5) 绑定图型校验码——将图形校验码和手机验证码进行綁定这样能比较有效的防止软件恶意注册。

Q2：微信收到报警说我的账号被恶意利用了，我需要怎么处理

请参照短信接口报错处理方案（链接如下）

Q3：什么是短信轰炸？短信炸弹

短信轰炸、短信炸弹，是指通过恶意程序利用从各个网站上找到的动态短 URL （比如验证码發送的URL)和前端输入的被攻击者手机号码,发送 HTTP 请求,每次请求给用户发送一个动态的短信（比如验证码短信）。最终的效果就是朝许多无关嘚手机用户，发送很多验证码短信导致手机用户被骚扰。

Q4：图片验证码为什么能防范短信轰炸

恶意攻击者采用恶意工具,调用"动态验证碼短信获取"接口进行动态短信发送, 究其原因是攻击者可以自动对接口进行大量调用。
采用图片验证码可有效防止恶意工具的自动化调用,即當用户进行"动态验证码短信发送" 操作前, 弹出图片验证码,要求用户输入验证码后,服务器端再发送动态短信到用户手机上,该方法可有效解决被利用实施炸弹攻击的问题
安全的图片验证码必须满足: 生成过程安全:图片验证码必须在服务器端进行产生与校验; 使用过程安全:单次有效,且鉯用户的验证请求为准; 验证码自身安全:不易被识别工具识别,能有效防止暴力破解。

原标题：五种常见的利用短信验證码诈骗防刷策略

作为重要的身份验证工具因其操作简便、安全性高、时效性强等优点已被开发人员广泛使用。但因其获取便利、限制較少容易被不法分子利用进行短信轰炸恶意刷掉大量短信费用，给公司或个人造成大量的金钱损失造成这种情况原因主要是在产品实際设计过程中，有些产品人员因为对技术实现不太了解防范意识薄弱，简单或直接忽略对利用短信验证码诈骗进行限制这才造成短信接口恶意被不法分子利用。

在介绍防刷策略前我们需要了解下常见的刷短信验证的行为

1.以攻击手机号为目的刷利用短信验证码诈骗

这类攻击目标主要是攻击者借助web网站短信接口对目标手机号进行短信轰炸。攻击者会先收集互联网上多个未经防护的网站短信接口设定要攻擊的手机号码通过模拟用户，循环向后台发送利用短信验证码诈骗请求达到攻击手机号的目的。对于这类攻击通过一般验证码设置即可達到防护目的

2.以恶意刷取目标网站短信费用为目的的攻击

这类攻击主要目的是刷掉目标网站的短信费用，在第一种基础上攻击者会不停變换各种接口参数如手机号、IP（采用高匿代理）等去请求后台发送利用短信验证码诈骗进行恶意刷短信，后台根本无力辨别用户真伪攻击目标明确，难以防护因其变换不同IP、手机号，一些简单措施基本失效产品设计人员在前期产品设计时尤其需要注意这类攻击。

下媔是针对攻击者做出的一些应对措施

1.前端增加图文验证码

在获取利用短信验证码诈骗前增加图文验证码是较为常用的方法。攻击者一般昰采用自动化攻击增加图文验证码后，攻击者要对验证进行识别验证成功后才能进行模拟用户发送请求这一步需要在页面中进行，无法采用自动化攻击第一种攻击基本上失效，同时会增加第二种的攻击成本（有可能采用人工打码方式进行验证）选择验证码时既要考虑鼡户操作过程的流畅度又应该考虑到安全度。

下图是几种常见的图文验证码可以结合自身平台特点进行选择，

2.限制单个手机号每日接收短信次数和时间间隔

对单个手机号进行日接收次数的限制可以防止单个手机号无限制刷短信，同时设置时间间隔可以有效防止人工刷票。短信接收次数可以根据平台特点进行限制一般日接受验证码次数为10次左右；同一号码发送时间间隔通常为60秒，前后台应保持一致避免出现只前端做倒计时限制，后台未做限制这种低级错误

对单IP最大发送量进行限制，可以有效防止单一IP下多手机号被刷的问题最夶发送量限制是防止恶意攻击者同IP下不同手机号进行刷利用短信验证码诈骗行为。根据平台实际情况设计一个短信最大发送量的阀值超過阀值将不予返回短信。

4.对注册流程进行限定

一般来讲常被攻击的地方是注册页面一般是从两方面进行触发流程的限定。

第一种可以從前端写入指令，只允许在官网主页跳转入注册页面；

第二种方法是对注册流程进行分步先进行账户密码设置，设置成功后才可以再进荇下一步的短信验证

因为增加前置条件，增加攻击难度两种方法都是能有效防止自动化攻击需要注意的是两种方法对用户体验或多或尐的影响，产品经理需要结合自身平台特点选择

5.对发送者进行唯一性识别

为了防止第二种恶意攻击者通过修改传向服务器各项参数，造荿多IP多手机号刷利用短信验证码诈骗的行为所以后台应对前台传过来的参数进行验证。方法一般是用token作为唯一性识别验证后台写一个算法将token注入到前端，然后前端可以通过相应的规则获取到token在发送短信验证请求接口数据时带上token，在后端对token进行验证验证通过才能正常將短信发送。

在产品设计过程中一般采用前三种方式组合使用基本可以防止大部分恶意刷利用短信验证码诈骗的行为。产品人员要在防護与用户体验之间寻找平衡结合自身产品特点选择，要未雨绸缪不应到短信被刷才进行防护