Esta postagem contém a etapa necessária para criar UDF no Apache Pig. Todo UDF deve estender uma função de filtro e deve conter um método chamado exec, que contém uma tupla. A lógica aplicada aqui é que se a Tupla for nula ou zero, ela fornecerá um valor Booleano: Verdadeiro ou Falso. E ‘IsofAge’ serve para verificar se a idade informada está correta ou não. A lógica da Função Definida pelo Usuário é escrita em códigos Java, onde o arquivo JAR será criado e então exportado. O arquivo JAR é registrado posteriormente. Esses arquivos JAR são encontrados nos arquivos de biblioteca do Apache Pig no momento do carregamento.
public class IsOfAge extends FilterFunc { @Sobrepor publicBoolean exec (tupla tupla) throwsIOException { if (tuple == null || tuple.size () == 0) { retorna falso } tentar{ Object object = tuple.get (0) if (objeto == null) { retorna falso } inti = objeto (inteiro) if (i == 18 || i == 19 || i == 21 || i == 23 || i == 27) { retornar verdadeiro } outro{ retorna falso }} catch (ExecExceptione) { thrownewIOException (e) }}}
Como chamar um UDF de porco?
Depois que uma UDF é criada, o seguinte comando deve ser usado para registrar o arquivo JAR.
registrar myudf.jar X = filtro A por IsOfAge (idade)
Etapas para criar UDF no Pig:
Existem várias funções predefinidas no Apache Pig. Também temos o recurso de criar nossa própria função que é User Defined Function (UDF). O Pig UDF é escrito em Java e isso requer a biblioteca Pig para usar as classes predefinidas. A biblioteca Apache Pig pig-0.8.0-cdh3u0-core.jar pode ser baixado da internet.
Clique aqui para ver as etapas de criação de um script Pig com UDF no modo HDFS.
java obter a data da string
Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.
Postagens relacionadas:
Script Apache Pig com UDF no modo HDFS
Operadores no Apache Pig: Parte 1 - Operadores relacionais
Operadores no Apache Pig: Parte 2 - Operadores de diagnóstico