Etapas para criar UDF no Apache Pig



O Apache Pig possui várias funções predefinidas. O post contém etapas claras para criar UDF no Apache Pig. Aqui, os códigos são escritos em Java e requer a Biblioteca Pig

Esta postagem contém a etapa necessária para criar UDF no Apache Pig. Todo UDF deve estender uma função de filtro e deve conter um método chamado exec, que contém uma tupla. A lógica aplicada aqui é que se a Tupla for nula ou zero, ela fornecerá um valor Booleano: Verdadeiro ou Falso. E ‘IsofAge’ serve para verificar se a idade informada está correta ou não. A lógica da Função Definida pelo Usuário é escrita em códigos Java, onde o arquivo JAR será criado e então exportado. O arquivo JAR é registrado posteriormente. Esses arquivos JAR são encontrados nos arquivos de biblioteca do Apache Pig no momento do carregamento.

 public class IsOfAge extends FilterFunc { @Sobrepor publicBoolean exec (tupla tupla) throwsIOException {   if (tuple == null || tuple.size () == 0) {   retorna falso } tentar{ Object object = tuple.get (0) if (objeto == null) {   retorna falso } inti = objeto (inteiro)   if (i == 18 || i == 19 || i == 21 || i == 23 || i == 27) {   retornar verdadeiro } outro{ retorna falso }} catch (ExecExceptione) { thrownewIOException (e) }}}

Como chamar um UDF de porco?

Depois que uma UDF é criada, o seguinte comando deve ser usado para registrar o arquivo JAR.





registrar myudf.jar X = filtro A por IsOfAge (idade)

Etapas para criar UDF no Pig:

Existem várias funções predefinidas no Apache Pig. Também temos o recurso de criar nossa própria função que é User Defined Function (UDF). O Pig UDF é escrito em Java e isso requer a biblioteca Pig para usar as classes predefinidas. A biblioteca Apache Pig pig-0.8.0-cdh3u0-core.jar pode ser baixado da internet.

Clique aqui para ver as etapas de criação de um script Pig com UDF no modo HDFS.



java obter a data da string

Tem alguma questão para nós? Mencione-os na seção de comentários e entraremos em contato com você.

Postagens relacionadas:

Script Apache Pig com UDF no modo HDFS



Operadores no Apache Pig: Parte 1 - Operadores relacionais

Operadores no Apache Pig: Parte 2 - Operadores de diagnóstico