多语言展示
当前在线:921今日阅读:27今日分享:41

如何将抓取到的带格式的数字提取出来

从网页抓取到的数字一般都带有格式,将其复制到txt文档中可以查看到都隐藏了哪些字符,如何获取到纯数字呢?
工具/原料
1

excel

2

记事本

示例

如下图是从网页抓取到数据,鼠标定位到的单元格在编辑栏只显示数字,并未显示单位,因此在excel中直接用查找替换的方法不可行。如果要获取到不带任何格式的数字有两种方法:END

方法一:利用txt记事本软件
1

txt记事本,在我看来就像照妖镜,不管你有三头六臂,在它这里无处遁形。复制单元格在txt记事本中粘贴,看看这个单元格里除了数字还有什么!——有文本标识符引号,空格,和汉字

2

知道单元格中都含有什么内容就好办了,在txt中查找替换即可只保留下纯数字了。

3

查找替换这个操作进行两遍,第一次将引号替换成空,第二次将大串的空格和汉字替换成空,要注意,1.引号与大串的空格和汉字直接从文档里复制即可,以免自己录入的文档中的不同,2.替换成空,即替换为的内容什么也不录入

4

全部替换后,将数字粘贴到对应所属的列即完成了数字提取。

方法二:利用excel函数提取
1

利用excel中的left()函数提取出数字

2

分析单元格的内容可以知道,数字的长度=第一个空格所在的位置-1找到第一个空格所在的位置:利用find()函数,=find(" ",D2); 最终公式是:=left(D2,find(" ",D2)-1)

3

最后将公式复制粘贴成值,再将值转化为数字(转化为数字这个操作,软件会自动出现个叹号提醒)即完成了数字提取

推荐信息