如何将此文本文件编辑为具有相同标头的合并信息

作者: 布偶的表弟派大星丶
发布时间: 2025-02-27 12:22:24 (1天前)
转自：

4 条回复

0#
回复此人
独奏♪ | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 假设记录在公共密钥中是连续的 </p> <pre> <code> $ awk -F' - ' '{if(p!=$1){if(v) print v; p=$1; v=$0} else v=v ", " $2} END {print v}' file EAST DUBBO - Unknown EAST MAITLAND - 1892, 1902, 1920, 1937, 1940, 1956 EBOR - 1905, 1911 EDEN - Unknown ELLENBOROUGH - 1905 ELONG ELONG - 1920, 1955 </code> </pre> </DIV>

编辑
1#
回复此人
star | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <pre> <code> awk -F'-' -v OFS='-' '{a[$1]=(a[$1]=="")?$2:a[$1]","$2}END{PROCINFO["sorted_in"]="@ind_str_asc";for(i in a)print i,a[i]}' file EAST DUBBO - Unknown EAST MAITLAND - 1892, 1902, 1920, 1937, 1940, 1956 EBOR - 1905, 1911 EDEN - Unknown ELLENBOROUGH - 1905 ELONG ELONG - 1920, 195 </code> </pre> <P> 简要说明， </p> <UL> <LI> <code> -F'-' -v OFS='-' </code> ：将输入和输出字段分隔符设置为“ - ” </LI> <LI> <code> a[$1]=(a[$1]=="")?$2:a[$1]","$2 </code> ：设置 <code> $1 </code> 作为数组中的键， <code> $2 </code> 作为价值。如果 <code> a[$1] </code> 已设置，附加到 <code> a[$1] </code> 。 </LI> <LI> <code> PROCINFO["sorted_in"]="@ind_str_asc" </code> ：这是 <code> gawk </code> 仅用于，用于按索引按升序排序作为字符串进行比较 </LI> </UL> </DIV>

编辑
2#
回复此人
甲基蓝 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 假设输入行按排序顺序（或以其他方式分组），可以使用sed完成： </p> <pre> <code> #!/bin/sed -f :loop # If we've reached the end, print it and exit # (Not required for GNU sed, whose N command continues) $q # read another line of input N # if the two lines have the same beginning, join them and repeat /^$.*$ - .*\n\1 - /s/\n.* - /,/ tloop # otherwise, print the first line and eliminate it P s/.*\n// bloop </code> </pre> </DIV>

编辑

登录后才能参与评论