天下功夫,内力为本,招数为末。欲练上乘内功,需搬运真气,让内息通行经脉。网优之内功心法,无非打通各大信令流程。如能滚瓜烂熟,且独辟蹊径,逆练经脉,则犹如网优之北冥神功,天下武功无不为我所用,天下故障无不为我所化。本秘籍虽为菊花派所创,然而天下内功都是一般,举一反三而已。
本秘籍偶拾于网络深谷,签名菊花派,如有版权问题,请联系小编处理!
1 接入问题定位优化方法
1.1 接入流程及问题表现
1.1.1 接入流程
接入流程可以分为四个步骤:
1)随机接入
2)RRC连接建立
3)鉴权
4)E-RAB建立
接入问题的主要表现也体现在这四个步骤上。
1.1.2 随机接入失败
随机接入失败的常见原因
1)ENB侧参数配置问题
2)UE侧参数配置问题
3)信道环境影响
4)核心网侧配置问题
备注:由于随机接入是L2的过程,在ENB侧没有明显的特征表现,需要结合UE侧的log来进行观察与判断
1.1.3 RRC连接建立失败
RRC连接建立的话统统计
1)【A点】
指标L.RRC.ConnReq.Att加1,不统计重发的次数
2)【C点】
指标L.RRC.ConnReq.Succ加1,不统计重发的次数
RRC建立连接失败在ENB侧的表现如下:
1)RRC_CONNECTION_CMP没有收到
2)ENB回复RRC_CONNECTION_REJECT
1.1.4 鉴权流程失败
这里所说的鉴权流程指的是在S1口上,ENB发起UE_INITIAL_MESSAGE到收到核心网侧发送的INITIAL_UE_context_Setup_REQ这之间的所有流程交互:
该流程存在问题导致接入失败的几个现象
1)UE与核心网直传消息空***互丢失(ENB侧来看是对应的上行直传消息没有收到)
2)核心网直接发送释放命令
3)核心网不响应或者响应过慢
1.1.4 E-RAB建立失败
E-RAB建立的话统统计
1)【A点】
如图中A点所示,当eNodeB收到来自MME的E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息时E-RAB建立尝试次数累加
2)【B点】
如图中B点所示,当eNodeB收到来自MME的E-RAB SETUP RESPONSE或者INITIAL CONTEXT SETUP RESPONSE消息时E-RAB建立成功次数累加
E-RAB建立失败在空口信令的表现
1)空口安全交互,UE回复FAIL
2)空口安全交互,UE未回复CMP
3)空口DRB建立重配,UE未回复CMP
4)空口UE能力查询,UE未回复
E-RAB建立失败S1口信令表现(空口信令交互正常)
1)核心网异常
2)无线资源申请失败
3)GTPU资源申请失败
1.2 问题定位、解决方法
接入失败问题定位规定动作
1.2.1 问题定位:第一板斧
话统分析
1)通过话统分析可以区分RRC建立失败或者E-RAB建立失败的TOP小区和统计TOP时间段
2)通过话统分析可以区分RRC建立失败是因为空口原因导致还是由于小区资源问题导致。
3)通过话统分析可以统计E-RAB建立过程,由于空口安全交互,UE回复FAIL导致建立失败的次数,该现象为UE和核心网交互失败导致,需要联合UE和CN共同定位。
1.2.2 问题定位:第二板斧
CHR日志分析
通过CHR日志分析可以获取RRC建立失败或者是E-RAB建立失败的top用户的TMSI。
1.2.3 问题定位:第三板斧
跟踪
1)标口跟踪:通过话统统计出top小区和top时间段后,在对应的小区和时间段开启标口跟踪,查看接入流程走到哪一步失败。
2)IFTS跟踪:在对应的小区和时间段开启IFTS跟踪,确认接入失败用户的链路质量状况。
3)启动单用户全网跟踪:通过TOP用户的TMSI在核心网侧获取其IMSI,然后启动该用户的全网跟踪。
1.2.4 问题解决方法
传输及核心网问题
从跟踪分析流程,如果属于核心网问题,需要联合核心网侧人员共同定位解决
ERAN侧异常
1)空口异常:上行受限、下行受限、覆盖空洞、干扰过大
2)基站异常:一般属于产品问题,需要相关产品日志进行分析定位
UE侧问题
如果统计显示一直是某个用户接入有问题,而该小区其他用户一直正常,该终端异常的可能性较大,需要通过获取的IMSI信息回溯,实地复现定位解决。
问题解决方法:上下行不平衡和覆盖空洞
无论是上下行不平衡还是覆盖空洞,均表现为链路质量较差
1)上行链路较差的表现就是RB缩到最小,上行MCS选择0阶,PHR已经在0db以下,而且上行BLER较大不收敛,CRC校验解错的概率较高。
2)下行链路较差的表现为UE上报CQI较差或者网络侧HARQ收到大量来自UE侧反馈的DTX和NACK
3)上行受限指的是上行较差而下行还可以;下行受限指的是上行还可以而下行较差;覆盖空洞指的是上下行链路均已较差。
对于上行受限可采用如下办法解决:
1)增加基站,减小下行小区覆盖距离
2)增加塔放,增加上行信号补偿
3)减小导频功率,减小下行小区覆盖距离
4)增加天线数,增强上行信号增益
对于下行受限可采用如下办法解决:
1)增加基站,减小下行小区覆盖距离
2)增大导频功率,增加下行小区覆盖距离
3)天线拉远,增强边缘覆盖
对于覆盖空洞
增加基站,增强覆盖。
2 切换问题定位优化方法
2.1 切换流程及问题表现
2.1.1 切换原理及信令流程
切换的过程就是终端在移动过程中与网络连接交互发生变化的过程:
LTE系统的整个切换过程完全由网络侧(eNB)控制,所以eNB需要监测UE所处的无线质量环境,这个过程是通过eNB下发测量控制让UE在满足一定条件时上报测量报告来实现的:
1)触发:当前我司eNB是采用A3事件触发同频切换,通过A2、A4事件来触发异频切换
2)切换:eNB下发切换命令给UE,UE收到切换命令后,中断与源小区的交互,按命令切换
2.1.2 切换失败
判断是否切换,通常以信令为判断依据,在终端侧,以发出触发切换的测量报告为开始,以切换完成消息为结束;
切换成功时,从UE侧观察表现为UE从一个源小区到一个新的小区(可从PCI变化来观察)进行正常业务交互;
Q1:测量报告丢失现象
UE侧发出测量报告后,但没有收到切换命令,在UE侧和eNB的现象分别如下:
Q2:切换命令丢失现象:
UE侧发出测量报告后,eNB收到测量报告,并下发切换命令,但UE侧没有收到;
UE侧看到的现象与切换测量报告丢失一样;从eNB侧看,则是收到测量报告下发切换命令后,在目标小区没有收到切换完成消息;
Q3:目标小区接入失败现象:
UE侧发出测量报告后,eNB收到测量报告,并下发切换命令,UE收到切换命令后,在目标小区发起接入,但目标侧没有收到切换完成消息,在UE侧和eNB的现象分别如下:
2.2 问题定位、解决方法
2.2.1 切换问题定位规定动作
设备状态检查
1)查询基站、小区告警,保证没有与切换相关的严重告警(如X2配置链路断开、RRU告警等)
2)检查测试终端是否能正常使用,是否支撑异频、异系统重选、切换功能
参数核查
1)确认切换开关状态
2)确认邻区配置,确认邻区关系、X2接口配置、传输配置
3)确认切换参数,比如切换门限,幅度迟滞,时间迟滞等
4)确认是否存在PCI冲突告警
切换失败TOP站邻区漏配检查
地理位置、网络规划角度,确认是否邻区漏配,并实施相应操作
2.2.2 切换问题的定位、解决方法
TOP1:邻区漏配核查:
从网络侧跟踪UU口和终端侧Uu口跟踪结合判断:
1)网络侧:同一用户(CALL ID)连续上报测量报告但没有下发切换命令,检查X2或S1跟踪中分别也没有HANDOVER REQUST及S1AP_HANDOVER_REQUIRED,则很可能是漏配的小区(通过查询配置确认);
2)终端侧:随着UE移动服务小区RSRP越来越差,SINR越来越差,而邻区RSRP越来越好,上报测量报告,没有收到切换命令;
TOP2:切换不及时:
当邻区无线质量满足切换门限时,服务小区的RSRP突然陡降:
1)修改服务小区与邻区的偏置CellIndividualOffset来提前切换
2)修改服务小区的延迟触发时间IntraFreqHoA3TimeToTrig来提前切换(建议配置为40ms到200ms之间的一个值,如80ms)
3)调整切换门限参数IntraFreqHoA3Hyst、 IntraFreqHoA3Offset来提前切换(此操作用得很少)
TOP2:弱覆盖:
从终端侧判断:
当邻区无线质量满足切换门限时,服务小区和邻区的RSRP都十分弱;
从网络侧判断:
从网络侧跟踪的UU口消息中,触发切换的A3测量报告记录的源小区、目标小区RSRP都很低,当测量报告中携带的服务小区RSRP值小于-110dBm时,可以认为处于信号质量微弱的区域,此时容易出现切换失败,需要调整覆盖;
弱覆盖的解决方法:
1)调整天线方向角、倾角:当下行先受限时,可以通过调整天线(如减小下倾角)补充远点的下行覆盖;
2)增加塔放、基站:当上行先受限时,可以通过增加塔放、增加小区(基站或接远RRU)的方式增强上行覆盖;
TOP3:乒乓切换:
乒乓切换的解决方法
1)相对调整两小区的CIO值,抵制乒乓切换;
2)当前默认使用同频切换门限为2dB,从前面整理出来的乒乓区域RSRP相对值来看,最大RSRP差距为4dB,所以设置CIO为-3dB,可以防止乒乓;
TOP3:干扰
干扰的表现
在RSRP比较好的情况下,吞吐率不如预期、容易出现切换失败甚至掉话等多种现象;
干扰的解决方法
找出干扰原因,去除干扰源
3 掉话问题定位优化方法
3.1 掉话流程及问题表现
3.1.1 LTE网络掉话定义
话统掉话定义
当eNodeB收到来自MME的E-RAB RELEASE COMMAND( UE CONTEXT RELEASE COMMAND)消息,或eNodeB向MME发送E-RAB RELEASE INDICATION( UE CONTEXT RELEASE REQUEST )消息,且释放原因不为“Normal Release”,“User Inactivity”,“Partial Handover”,“Handover triggered”,“successful-handover”,“cs-fallback-triggered”时统计该指标。如果E-RAB RELEASE COMMAND消息中要求同时释放多个E-RAB,则相应指标按各个业务的QCI分别进行累加。
3.2 问题定位、解决方法
3.2.1 掉话排查基本步骤
首先需要在话统侧获取全网的掉话率指标以及趋势,掉话率趋势分析至少需要1~2周左右的数据,如果全网掉话率指标突然偏高,一般实行步骤:
1)是否全网问题:
对MME及eNB侧进行告警排查(传输,设备等告警)、观察期间是否实施版本升级
2)是否存在Top小区:
●小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多而且掉话率高的Top小区
●对Top小区进行参数核查、告警检查等
●对引起掉话的Top原因进行定位分析
3)若是共性问题,将优化结果复制到全网
3.2.1 掉话问题定位、解决方法
Top1:参数对比
随机抽取部分站点的脚本与基线参数进行核对,对不一致的参数进行分析;
Top2:告警核查
1)是否存在传输告警:观察S1传输是否出现问题;
2)是否存在设备告警:观察eNB侧是否存在告警;
3)检查系统是否升级、打补丁等动作;
Top3:Top小区筛查
1)将小区级的掉话率指标和掉话绝对次数按从高到低的顺序进行排序,优先分析掉话绝对次数多且掉话率高的Top小区;
2)通常取每天掉话率高于平均指标的Top5小区进行分析,确定掉话的主要原因;
3.2.2 Top小区分析流程
1)获取小区级话统的掉话率指标及趋势,掉话率趋势分析至少1~2周左右的数据:
●如果小区的掉话率指标突然偏高,需要检查eNB侧是否存在该小区相关的告警信息,检测该小区所属eNB的告警,确认该小区是否出现故障等信息;
●常见的告警如RRU相关的告警,通道相关的告警,传输相关的告警,基带板相关的告警等;
2)分析CHR数据,获取导致掉话的各种原因的比例,按照比例从高到低的顺序分别针对不同的原因进行定位,并对各Top原因进行分析处理;
3)判断是否存在OM操作导致的站点复位,重启等导致的掉话;
4)检测是否有Top用户存在,如果有,需要对Top用户的log进行详细分析;
5)如果无法通过CHR数据定位解决的问题,需要通过抓取该Top小区内eNB侧的IFTS跟踪;
6)如果无法进一步深入分析,在需要使用测试终端进行复现,并抓取UE侧的log及内部打印信息进一步定位;
3.2.3 CHR原因统计
取每天的Top5站点通过InsightSharp对CHR数据进行分析,找到影响每个Top小区掉话率的主要原因:
3.2.4 CHR常见释放原因 3.2.5 Top用户排查
Top用户的确定
1)Top用户的判断主要是依据终端接入时上报的TMSI进行判定,HUAWEI核心网TMSI分配的机制是对于同一个IMSI用户,TMSI的右起第5位进行随机赋值,即某用户的TMSI中只有*指示的8bits位置发生变化,就是同一个用户,C0 6* 00 05;
2)TMSI可以通过CHR数据分析获取:
3.2.6 Top用户log分析 Step1:分析是否存在同频邻小区漏配或者错配导致的掉话;
Step2:分析是否存在弱覆盖导致的掉话;
Step3:分析是否由于切换来不及导致的掉话;
Step4:分析是否导频污染引起的掉话:
Step5:分析是否存在上行干扰导致的掉话:
如果掉话原因不是步骤1~5所述的原因,则很有可能是非RF原因导致的掉话,需要结合IFTS信息进一步定位;
如果是异常导致的掉话,则需要结合一键式日志、TTI跟踪等信息进行异常定位。
3.2.7 Top用户隔离定位
输入数据
1)eNB IFTS跟踪
2)UE TTI跟踪
3)UE侧路测log
4)eNB表口log
6)一键式日志
7)CHR日志
3.2.8 Top用户掉话分析四步曲
Step1:标口流程分析谁主动发起释放
1)eNB主动发起释放
eNB主动向核心网发起释放请求,收到核心网下发的释放命令后释放用户RRCConnRel、并向核心网反馈释放完成
2)核心网主动发起释放
eNB收到核心网下发的释放命令,释放用户RRCConnRel、并向核心网反馈释放完成
Step2:通过S1释放请求/命令中的释放原因值隔离掉话原因
1)无线侧原因触发释放
2)传输原因触发释放
3)NAS原因触发释放
4)协议原因触发释放
5)其他混合原因触发释放
Step3:CHR分析详细释放原因
Step4:复现问题抓取IFTS跟踪、UE侧Log,深度定位掉话根因
4 相关工具和信息获取方式
消息跟踪工具:
数据分析工具:
“切换测量控制”及“切换测量报告”消息的确认:
切换命令”消息的确认:
用消息查看App,打开UU接口“切换测量报告”消息后面的一条RRCConnectionReconfiguration消息,便可打开消息查看其详细内容,以UE侧跟踪的消息为例:
重建请求消息发送“小区”的确认:
重建请求消息是发往哪个小区的,在网络侧通过跟踪文件比较容易确认,在UE侧可用消息查看App查看UE侧UU接口“RRC_CONN_REESTAB_REQ”消息前的RRC_SIB_TYPE1消息,双击打开消息查看其详细内容
|