
Tenho dados em um sistema Linux, cerca de 44K pontos de dados, que gostaria de fazer um gráfico de dispersão. O gráfico deve ser salvo para que possa ser exibido em um site (JPG?).
Alguns outros parâmetros:
Eixo X: um dia por tick, máximo de 31 dias no total
Eixo Y: número inteiro 0-100, marcas de escala a cada 10
Gráfico de dispersão… NÃO desenhe linhas entre os pontos.
Cada ponto de dados se parece com:
20/10/2010 23:45:22,57
Gostaria de incluir rótulos para os eixos X e Y
Gostaria de incluir um título
Gostaria que os dias fossem 20/10 em cada ponto X ou simplesmente o número do dia
Alguma idéia sobre quais programas devo considerar... espero que sejam gratuitos. Posso escolher entre sistemas operacionais Linux, Centos 5.5, Fedora 13, Suse 11 SP1.
Obrigado pela sua ajuda e consideração.
Responder1
gnuplotdeve atender às suas necessidades. Ele pode renderizar em várias telas, como PNG e SVG.
Responder2
Rcom o excelente de Hadley Wickhamggplot2
biblioteca. A biblioteca gráfica integrada é completamente adequada, mas ggplot2
possui padrões bonitos e sensatos.
depois que o R for instalado para instalar o ggplot2:install.packages("ggplot2")
Supondo que seus dados tenham o formato:
date_time,value
10/20/2010 23:45:22,57
10/30/2010 23:45:22,102
Todo o seu script em R seria algo como:
mydata <- read.csv("path/to/csv/data.csv", sep=",",
header = TRUE, stringsAsFactors = FALSE)
mydata$date_time <- as.POSIXct(
strptime(mydata$date_time, "%m/%d/%Y %H:%M:%S")) #turns your dates
#into POSIX time objects
head(mydata) #just see that it looks good
library(ggplot2)
p <- ggplot(mydata, aes(date_time, value)) #make a ggplot2 plot object
p + geom_point() + ylab('Y label goes here') + #add points, ylabel, xlabel and a title
xlab("Date") + opts(title = "Snappy Title goes here")
Aqui está um que fiz enquanto respondia a esta pergunta usando oDados hidrográficos do USGS para Elwha