正则解析

This commit is contained in:
Àî×ÚÕñ 2022-09-09 14:03:45 +08:00
parent c7537d397d
commit 8741a643ff
2 changed files with 72 additions and 45 deletions

View File

@ -9,7 +9,8 @@ feedback_dict = {1: '已反馈', 0: '未反馈'}
# 面试轮次 # 面试轮次
interview_round_dict = {1: '初试', 2: '复试', 3: '终试'} interview_round_dict = {1: '初试', 2: '复试', 3: '终试'}
# 简历阶段 # 简历阶段
interview_stage_dict = {1: '初筛', 2: '用人部门复筛', 3: '初试', 4: '复试', 5: '沟通offer', 6: '待入职', 7: '淘汰', 8: '在职', 9: '离职'} interview_stage_dict = {1: '初筛', 2: '用人部门复筛', 3: '面试', 4: '沟通offer', 5: '待入职', 6: '放弃入职', 7: '已入职', 8: '转正', 9: '主动离职',
10: '被动离职', 11: '淘汰'}
# 简历来源 # 简历来源
owner_name_dict = {1: '前程无忧', 2: '人才库', 3: '智联招聘', 4: 'Boss直聘', 5: '58同城'} owner_name_dict = {1: '前程无忧', 2: '人才库', 3: '智联招聘', 4: 'Boss直聘', 5: '58同城'}
# 学历 # 学历

View File

@ -658,32 +658,46 @@ def fmt_txt(chk_str):
specialty_do = chk_upgrade_str1.split('专业技能')[-1].strip().strip('\n').split('\n') specialty_do = chk_upgrade_str1.split('专业技能')[-1].strip().strip('\n').split('\n')
remembrance_list_str = chk_upgrade_str1.split('专业技能')[0].strip().strip('\n') remembrance_list_str = chk_upgrade_str1.split('专业技能')[0].strip().strip('\n')
for i in remembrance_list_str.split('\n'): for i in remembrance_list_str.split('\n'):
dict_rem = {
"prize_name": '',
"prize_time": ''
}
if '??' in i: if '??' in i:
dict_rem = { dict_rem = {
"prize_name": i.split('??')[1], "prize_name": i.split('??')[1],
"prize_time": i.split('??')[0] "prize_time": i.split('??')[0]
} }
else: else:
dict_rem = { re_list = re.split('([0-9]{4}[.|/][0-9]{1,2})', i)
"prize_name": i.split(' ')[1], re_list = [i for i in re_list if i.strip()]
"prize_time": i.split(' ')[0].replace('.', '/') for str in re_list:
} if str[0].isdigit():
dict_rem['prize_time'] = str
continue
dict_rem['prize_name'] = str
str_rem = copy.deepcopy(dict_rem) str_rem = copy.deepcopy(dict_rem)
remembrance.append(str_rem) remembrance.append(str_rem)
elif '语言能力' in chk_upgrade_str1: elif '语言能力' in chk_upgrade_str1:
remembrance_list_str = chk_upgrade_str1.split('语言能力')[0].strip().strip('\n') remembrance_list_str = chk_upgrade_str1.split('语言能力')[0].strip().strip('\n')
for i in remembrance_list_str.split('\n'): for i in remembrance_list_str.split('\n'):
dict_rem = {
"prize_name": '',
"prize_time": ''
}
if '??' in i: if '??' in i:
dict_rem = { dict_rem = {
"prize_name": i.split('??')[1], "prize_name": i.split('??')[1],
"prize_time": i.split('??')[0] "prize_time": i.split('??')[0]
} }
else: else:
dict_rem = { re_list = re.split('([0-9]{4}[.|/][0-9]{1,2})', i)
"prize_name": re.split('([0-9]{4}.|/[0-9]{1,2})', i)[1], re_list = [i for i in re_list if i.strip()]
"prize_time": re.split('([0-9]{4}.|/[0-9]{1,2})', i)[0].replace('.', '/') for str in re_list:
} if str[0].isdigit():
dict_rem['prize_time'] = str
continue
dict_rem['prize_name'] = str
str_rem = copy.deepcopy(dict_rem) str_rem = copy.deepcopy(dict_rem)
remembrance.append(str_rem) remembrance.append(str_rem)
language_list = chk_upgrade_str1.split('语言能力')[-1].strip().strip('\n') language_list = chk_upgrade_str1.split('语言能力')[-1].strip().strip('\n')
@ -698,10 +712,20 @@ def fmt_txt(chk_str):
language_dict1['language_name'] = i.split('')[0] language_dict1['language_name'] = i.split('')[0]
for i1 in i.split('')[1].split('|'): for i1 in i.split('')[1].split('|'):
if '听说' in i1: if '听说' in i1:
language_dict1['reading'] = i1 stage_str = '初级'
if '良好' in i1 or '中极' in i1:
stage_str = '中级'
if '熟练' in i1 or '精通' in i1 or '高级' in i1:
stage_str = '高级'
language_dict1['reading'] = stage_str
continue continue
if '读写' in i1: if '读写' in i1:
language_dict1['writing'] = i1 stage_str = '初级'
if '良好' in i1 or '中极' in i1:
stage_str = '中级'
if '熟练' in i1 or '精通' in i1 or '高级' in i1:
stage_str = '高级'
language_dict1['writing'] = stage_str
language.append(language_dict1) language.append(language_dict1)
elif '培训经历' in chk_upgrade_str1: elif '培训经历' in chk_upgrade_str1:
remembrance_list_str = chk_upgrade_str1.split('培训经历')[0].strip().strip('\n') remembrance_list_str = chk_upgrade_str1.split('培训经历')[0].strip().strip('\n')
@ -727,6 +751,7 @@ def fmt_txt(chk_str):
if __name__ == '__main__': if __name__ == '__main__':
# txt = getText_pdf('D:\wokerplay\面试简历\智联招聘_聂礼旺_Web开发工程师_中文.pdf')
# 拉勾 # 拉勾
chk_str1 = """ chk_str1 = """
@ -1127,40 +1152,41 @@ vue.js良好
# 智联2 # 智联2
chk_str4 = """ chk_str4 = """
应聘职位 Web开发工程师 应聘职位 Web开发工程师
应聘机构 武汉乐谷在线科技有限公司 应聘机构 武汉乐谷在线科技有限公司 智联招聘
工作地点 武汉 工作地点 武汉
IDdKwLUJmFEUKjMy4LHsfzueVqNyJnCO9K 最近活跃时间6月10日 IDdKwLUJmFEUKjMy4LHsfzueVqNyJnCO9K 最近活跃时间6 10
聂礼旺     聂礼旺
   23 (1997年2月) 3年工作经验 大专 离职随时到岗
????23 (1997年2月) ????3年工作经验 ????大专 ????离职随时到岗
现居住地黄冈 红安县 | 户口黄冈 现居住地黄冈 红安县 | 户口黄冈
手机15771198025 手机15771198025
E-mailnie_fairy@163.com E-mailnie_fairy@163.com
求职意向 求职意向
web前端??武汉 web前端 武汉
4001-6000/?| 计算机软件?| 全职 4001-6000/| 计算机软件| 全职
工作经历 工作经历
2018.04 - 2019.10 ??湖北国网华中科技开发有限责任公司?? (1 7个月) 2018.04-2019.10 湖北国网华中科技开发有限责任公司 (1 7个月)
web前端开发 | 4001-6000/ web前端开发 |4001-6000/
计算机软件 计算机软件
工作描述 1百分百还原UI设计页面 工作描述 1百分百还原UI设计页面
2与后端沟通交流完成页面的交互作用 2与后端沟通交流完成页面的交互作用
3用vue原生JSbootstrapmui等框架完成项目 3用vue原生JSbootstrapmui等框架完成项目
4有独立项目开发经验会APP开发能熟练处理兼容问题 4有独立项目开发经验会APP开发能熟练处理兼容问题
项目经历 项目经历
2019.09 - 2019.10 武汉市配网规划资料管理系统移动端 2019.09-2019.10 武汉市配网规划资料管理系统移动端
项目描述 项目是一公司为国网武汉供电公司设计的一款用于各个区之间文件管理的app采用vue和mui框架构建 项目描述 项目是一公司为国网武汉供电公司设计的一款用于各个区之间文件管理的app采用vue和mui框架构建
2019.08 - 2019.09 湖北省汉江崔家营航电枢纽管理系统已上线 2019.08-2019.09 湖北省汉江崔家营航电枢纽管理系统已上线
项目描述 该项目是为湖北省汉江崔家营航电枢纽管理处设计的官网项目整体采用原生JS是崔家营航电管理处和湖北省运输交通厅连接的公众平台 项目描述 该项目是为湖北省汉江崔家营航电枢纽管理处设计的官网项目整体采用原生JS是崔家营航电管理处和湖北省
2018.08 - 2019.10 浙江浙能集团能源综合系统 运输交通厅连接的公众平台
项目描述 主要功能是入设计领导首页和数据展示页面通过canvas和echarts实现数据可视化操作更加生动形象的来展示数据 2018.08-2019.10 浙江浙能集团能源综合系统
2018.01 - 2018.05 医疗器械销售平台开发移动端 项目描述 主要功能是入设计领导首页和数据展示页面通过canvas和echarts实现数据可视化操作更加生动形象的来展
项目描述 项目是一款医院和医疗器械公司内部使用的手机端APP采用vue框架构建 中涉及mui触控滑动模块slide子页之间采用了懒加载技术保证用户体验 示数据
2018.01-2018.05 医疗器械销售平台开发移动端
项目描述 项目是一款医院和医疗器械公司内部使用的手机端APP采用vue框架构建 中涉及mui触控滑动模块slide
子页之间采用了懒加载技术保证用户体验
教育经历 教育经历
2016.09 - 2019.07 ??武汉软件工程职业学院 ??软件工程 ??大专 2016.09 - 2019.07 武汉软件工程职业学院 软件工程 大专
证书 证书
2018.06 ??大学英语四级 2018.06 大学英语四级
语言能力 语言能力
英语 读写能力良好 | 听说能力熟练 英语 读写能力良好 | 听说能力熟练
@ -1239,4 +1265,4 @@ jquery熟练
ajax一般 ajax一般
vue.js良好 vue.js良好
""" """
fmt_txt(chk_str3) fmt_txt(chk_str4)