
У меня есть файл данных abc.txt в следующем формате:
BALT 1
54.500 -161.070
3.95863757
0.01691576
BARM 2
-9.200 67.120
4.07529868
0.01951653
BKSR 3
43.830 142.520
4.08919819
0.00587340
Мне нужно преобразовать его в формат:
BALT 1
54.5000000 -161.070000
0.3958637E+01
0.1691576E-01
BARM 2
-9.20000000 67.1200000
0.4075298E+01
0.1951653E-01
BKSR 3
43.8300000 142.520000
0.4089198E+01
0.5873400E-02
Общее количество пробелов, занимаемых числами во 2-й строке, должно быть 10, не считая знака -ve (например, 54,500 как 54,5000000 и -161,070 как -161,070000). Пробелов для 3-й и 4-й строк должно быть 13 (например, 3,95863757 как 0,3958637E+01). А BALT или BARM являются переменными, это могут быть другие слова из четырех символов.
Спасибо.
решение1
версия 3используйте файл awk, например
function tenth(x) {
u = x ; if ( u < 0 ) u = -x ;
b=10 ;
a=b-2 ;
if ( u >= 10 ) {
d=int(log(u)/log(10)) ;
a=b-d-1 ;
}
printf "%*.*f",b,a,x ;
}
length($1) == 4 { print ; next ;}
NF == 1 { d=int(log($1)/log(10)) ;if (d> -1) d++ ; printf " %.7fE%+03d\n",$1/(10^d),d ;}
NF == 2 { printf " " ; tenth($1); printf " " ; tenth($2) ; printf "\n" ;}
где
lengtht$1) == 4 { print ; next ;}
оставит только строку, где первое поле состоит из четырех букв (хотя это может быть 1234)function tenth(x)
: определить функцию, которая корректирует форматирование."%*.*f"
строка регулирует размер/точность%f
преобразования. Первая * заменяется на b, вторая * заменяется на a.int(log()/log(10))
дать десятичный логарифм, который регулирует представление в соответствии с вашими конкретными потребностями?
используйте его с
awk -f f.awk input
которые дают в результате
BALT 1
54.5000000 -161.070000
0.3958638E+01
0.1691576E-01
BALT 2
-9.20000000 67.1200000
0.4075299E+01
0.1951653E-01
BALT 3
43.8300000 142.520000
0.4089198E+01
0.5873400E-02
0.00000000 1.00000000
-3.14150000 2.71828183
решение2
Может быть, что-то вроде:
awk '
!/[[:alpha:]]/{
if (NF == 1)
$0 = sprintf(" %.7E", $0 * 10)
else
$0 = sprintf(" %.8f %.8f", $1, $2)
}
{print}' | sed '
s/\([0-9.]\{10\}\)[0-9]*/\1/g
s/\([1-9]\)\.\(.*\).E/0.\1\2E/'
решение3
Вы можете получить его без awk с помощью:
while read line; do echo $line; read a; read b; read c; printf "%.7f %.7f\n %.7e\n %.7e\n" $a $b $c; done < data.txt
Однако использование printf таким образом может привести к некоторым проблемам, если вы используете некоторые локали, использующие запятую вместо точки. В этом случае вы должны быть в состоянии исправить это с помощью:
while read line; do echo $line; read a; read b; read c; LC_NUMERIC="en_US.UTF-8" printf "%.7f %.7f\n %.7e\n %.7e\n" $a $b $c; done < data.txt
Конечно, в скрипте его следует лучше форматировать с помощью возврата каретки и отступов.