[R-es] Resumen de R-help-es, Vol 91, Envío 30

Rafael Saturno rafael_saturno en hotmail.com
Jue Sep 15 12:12:28 CEST 2016


Obtener Outlook para Android<https://aka.ms/ghei36>



On Thu, Sep 15, 2016 at 5:31 AM -0430, "r-help-es-request en r-project.org" <r-help-es-request en r-project.org<mailto:r-help-es-request en r-project.org>> wrote:

Envíe los mensajes para la lista R-help-es a
        r-help-es en r-project.org

Para subscribirse o anular su subscripción a través de la WEB
        https://stat.ethz.ch/mailman/listinfo/r-help-es

O por correo electrónico, enviando un mensaje con el texto "help" en
el asunto (subject) o en el cuerpo a:
        r-help-es-request en r-project.org

Puede contactar con el responsable de la lista escribiendo a:
        r-help-es-owner en r-project.org

Si responde a algún contenido de este mensaje, por favor, edite la
linea del asunto (subject) para que el texto sea mas especifico que:
"Re: Contents of R-help-es digest...". Además, por favor, incluya en
la respuesta sólo aquellas partes del mensaje a las que está
respondiendo.


Asuntos del día:

   1. Re: Saltar filas no numericas al importar csv (Luisfo)
   2. Re: de pdf a csv (Mauricio Monsalvo)
   3. Re: de pdf a csv (eric)
   4. Re: Saltar filas no numericas al importar csv
      (javier.ruben.marcuzzi en gmail.com)
   5. Re: de pdf a csv (ignacio holzinger)


----------------------------------------------------------------------

Message: 1
Date: Wed, 14 Sep 2016 13:15:37 +0200
From: Luisfo <luisfo89 en yahoo.es>
To: Isidro Hidalgo Arellano <ihidalgo en jccm.es>,
        "=?UTF-8?Q?'Jes=c3=bas_Para_Fern=c3=a1ndez'?="
        <j.para.fernandez en hotmail.com>, r-help-es en r-project.org
Subject: Re: [R-es] Saltar filas no numericas al importar csv

Content-Type: text/plain; charset="UTF-8"

Buenas Jesús,

Se me ocurre lo siguiente.

# importar csv con 'stringsAsFactors=F' para evitar los factors
data <- read.csv("fichero.csv", header=F, stringsAsFactors = F)
# seleccionar las filas sólo numéricas
numericRows <- apply(!apply(apply(data,1,as.numeric),2,is.na),2,all)
# aplicar el filtro
data[numericRows,]

Espero que te sirva de ayuda.

Un saludo,

*Luisfo Chiroque*
/PhD Student | PhD Candidate
IMDEA Networks Institute/
http://fourier.networks.imdea.org/people/~luis_nunez/
<http://fourier.networks.imdea.org/people/%7Eluis_nunez/>

On 14/09/16 12:55, Isidro Hidalgo Arellano wrote:
> ¿No puedes adjuntar unas cuantas filas para verlo?
>
>
>
> De: Jesús Para Fernández [mailto:j.para.fernandez en hotmail.com]
> Enviado el: miércoles, 14 de septiembre de 2016 12:41
> Para: Isidro Hidalgo Arellano <ihidalgo en jccm.es>; r-help-es en r-project.org
> Asunto: Re: [R-es] Saltar filas no numericas al importar csv
>
>
>
> No me vale, porque no es un problema de columnas, es de filas.
>
>
> Cuando importo el csv, como tiene cada columna segun la fila o numeros o texto, R convierte la columna automaticametne en factor.
>
>
>
> He probado a convertir las columnas a numeric, pero tampoco me vale, ya que transforma el texto a numeros....
>
>
>
> ¿Alguna alternativa? estoy pensando ne poner skip y ne el skip meter las letras del abecedario.
>
>
>
>
>
>
>
>    _____
>
> De: Isidro Hidalgo Arellano <ihidalgo en jccm.es <mailto:ihidalgo en jccm.es> >
> Enviado: miércoles, 14 de septiembre de 2016 12:17
> Para: 'Jesús Para Fernández'; r-help-es en r-project.org <mailto:r-help-es en r-project.org>
> Asunto: RE: [R-es] Saltar filas no numericas al importar csv
>
>
>
> Hola:
> Yo lo que hago en esos casos es cargar una fila de datos. Con is.numeric() sabes si es numérico o no toda la columna, y luego cargo sólo las que lo son...
> Espero que te sirva.
>
>
> Isidro Hidalgo Arellano
> Observatorio del Mercado de Trabajo
> Consejería de Economía, Empresas y Empleo http://www.castillalamancha.es/
>
>
>   <http://www.castillalamancha.es/> Inicio | Gobierno de Castilla-La Mancha
>
> www.castillalamancha.es<http://www.castillalamancha.es> <http://www.castillalamancha.es>
>
> Web oficial del gobierno autonómico de Castilla-La Mancha con información sobre actividad administrativa, economía, educación, sanidad, servicios sociales, sede ...
>
>
>
>
> -----Mensaje original-----
> De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de Jesús Para Fernández
> Enviado el: miércoles, 14 de septiembre de 2016 11:47
> Para: r-help-es en r-project.org <mailto:r-help-es en r-project.org>
> Asunto: [R-es] Saltar filas no numericas al importar csv
>
> Buenas
>
>
> Quiero saltar las filas no numericas al importar un csv. Saltar las primeras filas es facil, con el
>
>
> read.csv("datos.csv",skip=30)
>
>
> El problema es que el csv tiene cada x filas un encabezado, y quiero que excel solo pille los datos.
>
> ?C?mo podr?a hacerlo?
>
> Gracias
>
> Jes?s
>
>          [[alternative HTML version deleted]]
>
>
>
>
>        [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es


        [[alternative HTML version deleted]]



------------------------------

Message: 2
Date: Wed, 14 Sep 2016 10:25:37 -0300
From: Mauricio Monsalvo <m.monsalvo en gmail.com>
To: Carlos Ortega <cof en qualityexcellence.es>
Cc: Lista R <r-help-es en r-project.org>, Dr. José A. Betancourt
        Bethencourt      <josebetancourt.cmw en infomed.sld.cu>
Subject: Re: [R-es] de pdf a csv
Message-ID:
        <CAKXoZH_P1z-6XRcfMrLMHj0--tKjyak-HwgqHhzk-mG9RPcNBA en mail.gmail.com>
Content-Type: text/plain; charset="UTF-8"

Hola.
Esta entrada también puede ser útil, al menos como ejemplo:
https://gist.github.com/sdgilley/15ebf67c5b01d12224f4b103c7065625 y tiene
el archivo .pdf que utiliza para descargar, así que puede seguirse el
código completo.
También está basada en pdftools
Saludos

El 12 de septiembre de 2016, 9:15, Carlos Ortega <cof en qualityexcellence.es>
escribió:

> Hola,
>
> Otra opción comentada "offline" ha sido la de:
>
> https://cloud.r-project.org/web/packages/pdftables/index.html
>

> https://pdftables.com.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es<http://www.qualityexcellence.es>
>
> El 12 de septiembre de 2016, 14:12, Isidro Hidalgo Arellano <
> ihidalgo en jccm.es> escribió:
>
> > A ver? yo he utilizado el paquete "tm", concretamente la función
> "readPDF".
> >
> > No es tarea fácil, y no por el paquete que vayas a utilizar, sino por la
> > propia codificación interna de un documento "PDF": te bailarán columnas y
> > filas en las tablas, así que hay que tener mucha paciencia y contemplar
> > todos los casos.
> >
> > A riesgo de meterme dónde no me llaman, revisa muy bien los datos
> cargados
> > desde un "PDF" antes de hacer nada con ellos?
> >
[[elided Hotmail spam]]
> >
> >
> >
> >
> >
> > Isidro Hidalgo Arellano
> >
> > Observatorio del Mercado de Trabajo
> >
> > Consejería de Economía, Empresas y Empleo
> >
> >  <http://www.castillalamancha.es/> http://www.castillalamancha.es/
> >
> >
> >
> >
> >
> >
> >
> > De: R-help-es [mailto:r-help-es-bounces en r-project.org] En nombre de Dr.
> > José
> > A. Betancourt Bethencourt
> > Enviado el: domingo, 11 de septiembre de 2016 0:31
> > Para: r-help-es en r-project.org
> > Asunto: [R-es] de pdf a csv
> >
> >
> >
> > Estimados
> >
> >
> >
> > En ocasionas hay informaciones epidemiológicas en reportes pdf semanales
> > como el que adjunto que quisiéramos llevar a csv o txt  USANDO R para
> poder
> > analizarlas estadísticamente. Apreciaríamos su ayuda si nos diesen un
> > script, el paquete pdftable no me resultó.
> >
> > Saludos
> >
> > José
> >
> >
> >         [[alternative HTML version deleted]]
> >
> >
> > _______________________________________________
> > R-help-es mailing list
> > R-help-es en r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es<http://www.qualityexcellence.es>
>
>         [[alternative HTML version deleted]]
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



--
Mauricio

        [[alternative HTML version deleted]]



------------------------------

Message: 3
Date: Wed, 14 Sep 2016 13:33:53 -0300
From: eric <ericconchamunoz en gmail.com>
To: "=?UTF-8?Q?Dr._Jos=c3=a9_A._Betancourt_Bethencourt?="
        <josebetancourt.cmw en infomed.sld.cu>, r-help-es en r-project.org
Subject: Re: [R-es] de pdf a csv
Message-ID: <57D97BF1.409 en gmail.com>
Content-Type: text/plain; charset=utf-8; format=flowed

Hola Jose, con frecuencia tengo que extraer datos de tablas en articulos
en PDF tambien, lo que hago es lo siguiente, que no es todo lo
automatico que uno quisiera pero al menos no tengo que copiar los datos
uno a uno:

1. en linux existe la herramienta pdftotext, que cuando la usas con la
opcion -layout mantiene, tanto como es posible, el layout original del
texto, con las tablas me ha funcionado bastante bien

2. con lo anterior obtienes un archivo de texto plano

3. abro el archivo y borro todo excepto la tabla que necesito

4. lo importo en R con read.table() u otra funcion similar


Ahora, tu tabla es bastante compleja, quiero decir que para poder usarla
como un data.frame tendras que hacer algun trabajo extra como incluir
algunos de los encabezados en columnas adicionales

eso, ojala te sirva.


Saludos, Eric.





On 09/10/2016 07:30 PM, Dr. José A. Betancourt Bethencourt wrote:
> Estimados
>
> En ocasionas hay informaciones epidemiológicas en reportes pdf semanales
>   como el que adjunto que quisiéramos llevar a csv o txt  USANDO R para
> poder analizarlas estadísticamente. Apreciaríamos su ayuda si nos diesen
> un script, el paquete pdftable no me resultó.
>
> Saludos
>
> José
>
>
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

--
Forest Engineer
Master in Environmental and Natural Resource Economics
Ph.D. student in Sciences of Natural Resources at La Frontera University
Member in AguaDeTemu2030, citizen movement for Temuco with green city
standards for living

Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
lectores de correo.



------------------------------

Message: 4
Date: Wed, 14 Sep 2016 13:37:06 -0300
From: <javier.ruben.marcuzzi en gmail.com>
To: Jesús Para Fernández <j.para.fernandez en hotmail.com>,
        "r-help-es en r-project.org" <r-help-es en r-project.org>
Subject: Re: [R-es] Saltar filas no numericas al importar csv
Message-ID: <57d97cb3.4743370a.b625c.efbd en mx.google.com>
Content-Type: text/plain; charset="UTF-8"

Estimado Jesús Para Fernández

Entonces entiendo que el problema no es justo el saltar filas no numéricas, posiblemente en el siguiente ejemplo se explique el problema.

Los datos son algo como columnas y cada cierta cantidad  un encabezado como

Nombre  Árbol   identificación   altura   color
Pino navidad
                Pino    1               3       verde
                Pino    2               2       verde claro
?.              ?       ?               ?       ?
Pino jardín
                Pino    699             6       verde

¿Usted tiene los datos en un archivo de texto aproximado al ejemplo?

Javier Rubén Marcuzzi

De: Jesús Para Fernández
        [[alternative HTML version deleted]]


------------------------------

Message: 5
Date: Wed, 14 Sep 2016 18:50:02 +0200
From: ignacio holzinger <holzingerignacio en gmail.com>
To: eric <ericconchamunoz en gmail.com>
Cc: r-help-es en r-project.org, Dr. José A. Betancourt Bethencourt
        <josebetancourt.cmw en infomed.sld.cu>
Subject: Re: [R-es] de pdf a csv
Message-ID:
        <CAMoSf9DqfNVy0JAFVcE5J2GoXwnhMgCOQaeY4JJZeyfkLUMA7A en mail.gmail.com>
Content-Type: text/plain; charset="UTF-8"

Saludos.
Te iba a decir lo mismo que Eric. Esas tablas "mal formadas" donde se
fusionan celdas son difíciles de manejar en "piloto automático". Casi
siempre hay que hacer manualidades.
De entre las soluciones que te han aportado esta última es la que suelo
utilizar.
Suerte.

El 14 sept. 2016 18:37, "eric" <ericconchamunoz en gmail.com> escribió:

> Hola Jose, con frecuencia tengo que extraer datos de tablas en articulos
> en PDF tambien, lo que hago es lo siguiente, que no es todo lo automatico
> que uno quisiera pero al menos no tengo que copiar los datos uno a uno:
>
> 1. en linux existe la herramienta pdftotext, que cuando la usas con la
> opcion -layout mantiene, tanto como es posible, el layout original del
> texto, con las tablas me ha funcionado bastante bien
>
> 2. con lo anterior obtienes un archivo de texto plano
>
> 3. abro el archivo y borro todo excepto la tabla que necesito
>
> 4. lo importo en R con read.table() u otra funcion similar
>
>
> Ahora, tu tabla es bastante compleja, quiero decir que para poder usarla
> como un data.frame tendras que hacer algun trabajo extra como incluir
> algunos de los encabezados en columnas adicionales
>
> eso, ojala te sirva.
>
>
> Saludos, Eric.
>
>
>
>
>
> On 09/10/2016 07:30 PM, Dr. José A. Betancourt Bethencourt wrote:
>
>> Estimados
>>
>> En ocasionas hay informaciones epidemiológicas en reportes pdf semanales
>>   como el que adjunto que quisiéramos llevar a csv o txt  USANDO R para
>> poder analizarlas estadísticamente. Apreciaríamos su ayuda si nos diesen
>> un script, el paquete pdftable no me resultó.
>>
>> Saludos
>>
>> José
>>
>>
>>
>> _______________________________________________
>> R-help-es mailing list
>> R-help-es en r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
> --
> Forest Engineer
> Master in Environmental and Natural Resource Economics
> Ph.D. student in Sciences of Natural Resources at La Frontera University
> Member in AguaDeTemu2030, citizen movement for Temuco with green city
> standards for living
>
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos
> lectores de correo.
>
> _______________________________________________
> R-help-es mailing list
> R-help-es en r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>

        [[alternative HTML version deleted]]



------------------------------

Subject: Pié de página del digest

_______________________________________________
R-help-es mailing list
R-help-es en r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

------------------------------

Fin de Resumen de R-help-es, Vol 91, Envío 30
*********************************************

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es