Форматирование из десятичного в экспоненциальное

Форматирование из десятичного в экспоненциальное

У меня есть файл данных abc.txt в следующем формате:

BALT 1
 54.500 -161.070
 3.95863757
 0.01691576
BARM 2
 -9.200 67.120
 4.07529868
 0.01951653
BKSR 3
 43.830 142.520
 4.08919819
 0.00587340

Мне нужно преобразовать его в формат:

BALT 1
 54.5000000 -161.070000
 0.3958637E+01
 0.1691576E-01
BARM 2
 -9.20000000 67.1200000
 0.4075298E+01
 0.1951653E-01
BKSR 3
 43.8300000 142.520000
 0.4089198E+01
 0.5873400E-02

Общее количество пробелов, занимаемых числами во 2-й строке, должно быть 10, не считая знака -ve (например, 54,500 как 54,5000000 и -161,070 как -161,070000). Пробелов для 3-й и 4-й строк должно быть 13 (например, 3,95863757 как 0,3958637E+01). А BALT или BARM являются переменными, это могут быть другие слова из четырех символов.

Спасибо.

решение1

версия 3используйте файл awk, например

function tenth(x) {
  u = x ; if ( u < 0 ) u = -x ;
  b=10 ;
  a=b-2 ;
  if ( u >= 10 ) {
  d=int(log(u)/log(10)) ;
  a=b-d-1 ;
  }
  printf "%*.*f",b,a,x ;
}
length($1) == 4 { print ; next  ;}
NF == 1 { d=int(log($1)/log(10)) ;if (d> -1) d++ ; printf " %.7fE%+03d\n",$1/(10^d),d ;}
NF == 2 { printf " " ; tenth($1); printf " " ; tenth($2) ; printf "\n" ;}

где

  • lengtht$1) == 4 { print ; next ;} оставит только строку, где первое поле состоит из четырех букв (хотя это может быть 1234)
  • function tenth(x): определить функцию, которая корректирует форматирование.
  • "%*.*f"строка регулирует размер/точность %fпреобразования. Первая * заменяется на b, вторая * заменяется на a.
  • int(log()/log(10))дать десятичный логарифм, который регулирует представление в соответствии с вашими конкретными потребностями?

используйте его с

awk -f f.awk input

которые дают в результате

BALT 1
 54.5000000 -161.070000
 0.3958638E+01
 0.1691576E-01
BALT 2
 -9.20000000 67.1200000
 0.4075299E+01
 0.1951653E-01
BALT 3
 43.8300000 142.520000
 0.4089198E+01
 0.5873400E-02
 0.00000000 1.00000000
 -3.14150000 2.71828183

решение2

Может быть, что-то вроде:

awk '
  !/[[:alpha:]]/{
    if (NF == 1)
      $0 = sprintf(" %.7E", $0 * 10)
    else
      $0 = sprintf(" %.8f %.8f", $1, $2)
  }
  {print}' | sed '
    s/\([0-9.]\{10\}\)[0-9]*/\1/g
    s/\([1-9]\)\.\(.*\).E/0.\1\2E/'

решение3

Вы можете получить его без awk с помощью:

while read line; do echo $line; read a; read b; read c;  printf "%.7f %.7f\n %.7e\n %.7e\n" $a $b $c; done < data.txt

Однако использование printf таким образом может привести к некоторым проблемам, если вы используете некоторые локали, использующие запятую вместо точки. В этом случае вы должны быть в состоянии исправить это с помощью:

while read line; do echo $line; read a; read b; read c; LC_NUMERIC="en_US.UTF-8" printf "%.7f %.7f\n %.7e\n %.7e\n" $a $b $c; done < data.txt

Конечно, в скрипте его следует лучше форматировать с помощью возврата каретки и отступов.

Связанный контент