Входные данные Logstash TCP не передаются в ElasticSearch

Входные данные Logstash TCP не передаются в ElasticSearch

После успешной настройки ELK с файловыми входами, logstash-forwarder и просмотра логов в потоке Kibana с нескольких серверов я попытался настроить TCP-вход:

tcp {
    codec => "json"
    host => "localhost"
    port => 9250
    tags => ["sensu"]
  }

Отправитель — sensu, и сообщения действительно в формате JSON — проверил это с помощью команды tcpdump.

Журнал Logstash показывает, что соединения принимаются:

{:timestamp=>"2015-06-15T14:03:39.832000+1000", :message=>"Accepted connection", :client=>"127.0.0.1:38065", :server=>"localhost:9250", :level=>:debug, :file=>"logstash/inputs/tcp.rb", :line=>"146", :method=>"client_thread"}
{:timestamp=>"2015-06-15T14:03:39.962000+1000", :message=>"config LogStash::Codecs::JSONLines/@charset = \"UTF-8\"", :level=>:debug, :file=>"logstash/config/mixin.rb", :line=>"112", :method=>"config_init"}
{:timestamp=>"2015-06-15T14:03:39.963000+1000", :message=>"config LogStash::Codecs::Line/@charset = \"UTF-8\"", :level=>:debug, :file=>"logstash/config/mixin.rb", :line=>"112", :method=>"config_init"}

Однако, судя по всему, дальше данных дело не идет, и их невозможно найти в Kibana.

Я зашел так далеко, что отключил другие входы, а затем наблюдал за шардом в elasticsearch (curl 'localhost:9200/_cat/shards'), который не увеличился в размере.

В соответствии сэта ссылкаЯ на правильном пути, но, возможно, просто где-то делаю глупости... Заранее спасибо.

logstash.conf:

input {
  file {
    path => ["/var/log/messages", "/var/log/secure", "/var/log/iptables"]
    type => "syslog"
    start_position => "end"
  }

  lumberjack {
    port => 5043
    type => "logs"
    ssl_certificate => "/etc/pki/tls/certs/logstash-forwarder.crt"
    ssl_key => "/etc/pki/tls/private/logstash-forwarder.key"
  }

  tcp {
    codec => "json"
    host => "localhost"
    port => 9250
    tags => ["sensu"]
  }

}

output {
  elasticsearch {
    host => "localhost"
    cluster => "webCluster"
  }
}

elasticsearch.yml:

cluster.name: webCluster
node.name: "bossNode"
node.master: true
node.data: true
index.number_of_shards: 1
index.number_of_replicas: 0
network.host: localhost

решение1

После нескольких дней разочарований я пришел к выводу, что кодек json/json_lines неисправен — возможно, только при использовании с входными данными TCP.

Однако я нашел обходной путь, используя фильтр:

filter {
  if ("sensu" in [tags]) {
    json {
      "source" => "message"
    }
  }
}

Это и несколько мутаций дают тот эффект, которого я изначально пытался добиться. Для потомков вот мой рабочий logstash.conf, который объединяет логи и данные метрик процессора/памяти из sensu:

input {
  file {
    path => [
      "/var/log/messages"
      , "/var/log/secure"
    ]
    type => "syslog"
    start_position => "end"
  }

  file {
    path => "/var/log/iptables"
    type => "iptables"
    start_position => "end"
  }

  file {
    path => ["/var/log/httpd/access_log"
        ,"/var/log/httpd/ssl_access_log"
    ]
    type => "apache_access"
    start_position => "end"
  }

  file {
    path => [
      "/var/log/httpd/error_log"
      , "/var/log/httpd/ssl_error_log"
    ]
    type => "apache_error"
    start_position => "end"
  }

  lumberjack {
    port => 5043
    type => "logs"
    ssl_certificate => "/etc/pki/tls/certs/logstash-forwarder.crt"
    ssl_key => "/etc/pki/tls/private/logstash-forwarder.key"
  }

  tcp {
    host => "localhost"
    port => 9250
    mode => "server"
    tags => ["sensu"]
  }

}

filter {
  if ("sensu" in [tags]) {
    json {
      "source" => "message"
    }
    mutate {
      rename => { "[check][name]" => "type" }
      replace => { "host" => "%{[client][address]}" }
      split => { "[check][output]" => " " }
      add_field => { "output" => "%{[check][output][1]}" }
      remove_field => [ "[client]", "[check]", "occurrences" ]
    }
  } else if([type] == "apache_access") {
    grok {
      match => { "message" => "%{IP:client}" }
    }
  }
}

filter {
  mutate {
    convert => { "output" => "float" }
  }
}

output {
  elasticsearch {
    host => "localhost"
    cluster => "webCluser"
  }
}

Не относится к проблеме: "Выход" получается в виде нескольких значений, разделенных пробелами, отсюда и операция "разделить". Второй элемент используется, а затем преобразуется в float, так что Kibana прекрасно его графически отображает (то, чему я научился на собственном горьком опыте).

Связанный контент