[R-es] Codificación redes neuronales, reconocimiento patrón, otras

Javier Marcuzzi j@vier@ruben@m@rcuzzi @ending from gm@il@com
Lun Mayo 7 14:48:10 CEST 2018


Estimados

He resuelto mi preocupación, por un lado creando una columna que de un
punto fijo, por ejemplo vehículo, entonces todas las demás columnas son
auto, bici, Ferrari, etc., pero a este punto fijo no lo puedo calcular como
cluster, sería sencillo pero en lugares como mi país donde es
extremadamente difícil ver una Ferrari (son mucho más caras que en Europa),
este punto fijo debe tener intervención humana porque de las formas que
conozco en el caso de Ferrari Argentina darían cualquier cosa bajo una
clasificación automatizada, luego sería posible algún otro análisis como
una red neuronal.

Dicho de otra forma, este punto fijo asegura un renglón independiente de
las columnas siguientes, con un resultado fijado para el entrenamiento, por
ejemplo el punto fijo señal de tránsito, con tres columnas, rojo, amarillo
y azul, dan únicamente semáforo, por otro lado en punto fijo color estos se
repiten pero con otro significado, u otro punto dijo juguete donde puede
ser exactamente rojo, amarillo, verde, y ser semáforo, pero al cruzar los
datos puedo detectar semáforos reales de los de juguete.

Lógicamente no di con una forma automatizada para calcular puntos fijos sin
intervención humana, estos serían como un grupo cluster, pero no encontré
la forma de evitar que datos con pocos valores no sean detectados como
ruido cuándo en realidad son importantes, pero escasos como el oro o un
diamante, motivo por el cuál estos costosos y en su costo está la
importancia aunque sus números en unidades sean muy pequeños en relación al
resto de objetos.

Javier Rubén Marcuzzi





El 4 de mayo de 2018, 17:19, Javier Marcuzzi <
javier.ruben.marcuzzi en gmail.com> escribió:

> Estimados
>
> Estoy pensando en una forma para acomodar datos, estos son una sola o más
> de una palabra, la única palabra o asociación de estas tiene un
> significado, no estaba pensando en un análisis en particular, pero sí en
> algo que pueda ser procesado por redes neuronales reconociendo ciertos
> patrones, pero que permita un análisis bajo otras técnicas, posiblemente en
> un ejemplo se comprenda mejor.
>
> Supongamos unas palabras como
>
> Azul
>
> Rojo
>
> Verde
>
> Amarillo
>
> Auto
>
> Bicicleta
>
> Ferrari
>
> Semáforo
>
> Color
>
> Vehículo
>
>
>
> Ahora supongamos tres columnas, la cuarta es el significado, y puede haber
> columnas vacías
>
> Azul                       |                              |
> = Color y azul
>
> Rojo                      |Verde                 |Amarillo            =
> Semáforo y color
>
> Semáforo           |                              |
> = Semáforo
>
> Auto                     |                             |
> = Vehículo y auto (no bici)
>
> Auto                     |Rojo                    |
> = Ferrari  * pero también vehículo
>
> Auto                     |Rojo                    |Vehículo           =
> Vehículo * , auto, color y ferrari
>
>
>
> Por ejemplo, está claro que los compradores de autos Ferrari posiblemente
> tengan un gusto asociado al color rojo. Ese puede ser un análisis
>
> Pero si yo quiero reconocer lo que hay según el patrón de palabras, tipo
> ejemplos de redes neuronales, en el último ejemplo con tres palabras tengo
> cuatro posibilidades (auto, rojo, vehículo) => vehículo, auto, color,
> Ferrari, pero en el ejemplo dos (Rojo, Verde, Amarillo) => semáforo, como
> color, pero el reconocimiento importante es casi únicamente semáforo.
>
> Hay ejemplos donde se buscan patrones en una foto y se reconocen objetos,
> pero en un esquema como el que describo, donde el resultado que puede ser
> más de uno, también está en la entrada, esta entrada en el ejemplo son tres
> columnas, pero todas tienen palabras que están en una sola lista.
>
> ¿Alguna sugerencia o ejemplo? En otras palabras, yo podría realizar una
> tabla pero hay formas que quedaría afuera, porque auto, rojo, vehículo no
> se me ocurriría, salvo que piense en un análisis posterior donde analizo
> bicicletas rojas vs autos rojos, o pelota roja donde una pelota no es
> vehículo pero en la playa por ahí prefieren las rojas o amarillas antes de
> las azules. Entonces posiblemente hay una forma de codificar para luego
> poder hacer análisis no pensados al momento de codificar los datos. Esta
> segunda parte estaría contemplada al colocar columnas, pero se me crean
> dudas para las redes neuronales.
>
> Desde ya muchas gracias
>

	[[alternative HTML version deleted]]



Más información sobre la lista de distribución R-help-es