博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
linux提取指定列字符并打印所有内容(awk)
阅读量:7070 次
发布时间:2019-06-28

本文共 1563 字,大约阅读时间需要 5 分钟。

假设有文件长如下样子:

CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT  samplename

1 3552841 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

1 3552842 . T . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

2 3552843 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

2 3552844 . T . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

3 3552845 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

3 3552846 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

4 3552847 . A . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

5 3552848 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

6 3552849 . A . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

7 3552850 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

现提取第一列字符为“3”,并打印出符合第一列为“3”的所有列,同时保存,则可以用以下命令:

awk -F " " '{if($1~/^3/) print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10}' sample.vcf > samplecol.vcf  #{if($1~/^3/) print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10}' 的意思是,在文件sample.vcf中,如果第一列($1)里面有匹配(~)正则表达式(/^3/)的话,那么就输出(print)到标准输出。保存到samplecol.vcf文件中。

输出的文件如下:

3 3552845 . G . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

3 3552846 . C . 32.995 . DP=1;MQ0F=0;AF1=0;AC1=0;DP4=1,0,0,0;MQ=40;FQ=-29.9912 GT:PL:DP 0/0:0:1

 

转载于:https://www.cnblogs.com/chenwenyan/p/7056882.html

你可能感兴趣的文章
基于KNN的相关内容推荐
查看>>
我的友情链接
查看>>
我的软考历程(二)网络规划师
查看>>
hive lock监控
查看>>
windows 2008无线网络“没有正确配置为使用IP协议” 错误解决办法
查看>>
php Imagick 实现等比缩放图片
查看>>
python守护进程
查看>>
JAVA第一次作业
查看>>
Nginx 完整配置说明
查看>>
spark安装
查看>>
常用的shell命令汇总
查看>>
ORA-00283、ORA-01114
查看>>
在linux下安装eclipse以及运行c++程序的安装步骤
查看>>
kprobes调试驱动
查看>>
MySQL C#连接ySQL保存当前时间,时分秒都是0,只有日期
查看>>
Java GC 专家系列5:Java应用性能优化的原则
查看>>
访问网址(使用CDN)时 智能DNS调度 与 用户定位调度(根据IP定位)
查看>>
zencart新增categories分类表字段步骤
查看>>
《阿里技术参考图册》算法与研发篇
查看>>
第一次线程使用经验总结
查看>>