13. Data Transformation → Filtering → Filter Examples

Este operador toma un Conjunto de Ejemplos como entrada y devuelve un nuevo Conjunto de Ejemplos incluyendo sólo los Ejemplos que cumplen con una condición.

Se pueden aplicar filtros arbitrarios especificando una implementación de Condition y una cadena de parámetro. Los usuarios pueden implementar sus propias condiciones escribiendo una subclase de la clase anterior e implementando un constructor de 2 argumentos que toma un Conjunto de Ejemplos y una cadena de parámetro. Esta cadena de parámetro se especifica mediante el parámetro parameter_string. En lugar de utilizar una de las condiciones predefinidas, los usuarios pueden definir sus propias implementaciones con el nombre de clase completamente adecuado.

Para attribute_value_condition la cadena de parámetro debe tener la forma atributo op valor, donde atributo es el nombre de un atributo, valor es un valor que el atributo puede tomar y op es uno de los operadores lógicos binarios similares a los conocidos de Java, por ejemplo, mayor o igual que (>=). Observar que se puede definir un OR lógico de varias condiciones con || y un AND lógico de dos condiciones con dos ampers and (&&) - o simplemente aplicando varios operadores ExampleFilter en una fila. Tener en cuenta también que para los atributos nominales se puede definir una expresión regular para el valor de posibles comprobaciones de igualdad y desigualdad.

Para unknown_attributes la cadena de parámetro debe estar vacía. Este filtro elimina todos los ejemplos que contienen atributos con valores faltantes o ilegales. Para unknown_label la cadena de parámetro también
debe estar vacía. Este filtro elimina todos los ejemplos con un valor de etiqueta desconocido.