A West Coast, provedora de plataformas para big data, lançou o framework da aplicação Cascading 2.0, nesta semana. O alvo são os desenvolvedores Java que usam Apache Hadoop para criar processamento de dados e aplicações de gerenciamentos de dados. A plataforma chega como uma API alternativa para MapReduce.
Esse é um framework de aplicação que pode ser desenvolvido em clusters que rodam na nuvem ou em data centers privados. É mais provável que o Cascading 2.0 seja de interesse entre os programadores Java que mantêm olho fixo no Hadoop – mas pode também despertar o interesse dos membros da comunidade open source que compartilham conexões ou associação com o fundador da empresa Chris Wensel, autor do projeto de código aberto em para processamento de dados.
A empresa possui o Razorfish e o Twitter entre suas referências de clientes e diz que ambos usam a plataforma para otimizar o processamento de dados, filtragem de dados e otimização de fluxo de trabalho para grandes volumes de dados não estruturados e semiestruturados.
O Cascading é também o cerne de extensões de linguagem, incluindo PyCascading, Scalding, e Cascalog (projetos de código aberto patrocinado pelo Twitter) e ferramentas, incluindo o CloudFront LogAnalyzer (desenvolvido pela Amazon).
Cientistas de dados, administradores Hadoop e desenvolvedores de apps
De acordo com o blog da empresa, o framework do Cascading é projetado para cientistas, administradores de dados Hadoop, e desenvolvedores de aplicativos, já que eles colaboram, desenvolvem e implantam aplicações escaláveis de big data.
“Criar aplicativos em Hadoop, apesar da crescent adoção nas empresas, não é notoriamente difícil. Nós dividimos o futuro do desenvolvimento e do gerenciamento de aplicações na plataforma, ao permitir que as companhias extraiam rapidamente informações importantes de grandes quantidades de dados distribuídos e melhor entendimentos das implicações nos negócios. Facilitamos a criação de aplicações de processamento de dados poderosas para Hadoop, sem requerer meses gastos em aprendizado sobre os meandros do MapReduce”, afirmou Wensel.
Importante para os desenvolvedores de aplicativos aqui é a oportunidade de construir e testar aplicações em seus desktops com a linguagem de sua escolha (Java, Jython, Scala, Clojure, ou JRuby) com o que foi descrito como “construções familiares e componentes reutilizáveis” – isso, em teoria, lhes dá a capacidade de “instantaneamente” implantar seus apps em grupos de centenas de nodes.
“A Microsoft está comprometida com a compatibilidade com o Apache Hadoop para os nossos próximos serviços baseados no Windows Server e do Windows Azure”, disse Bob Baker, diretor e sócio do canal de marketing da Microsoft. “Em testes, O Cascading no Windows Server trabalhou diretamente fora da caixa e estamos certificando Cascading 2.0 no Windows Server para dar aos clientes uma forma flexível de desenvolvimento de aplicações big data para o Hadoop que lhes permite criar e implantar aplicativos para a plataforma em Windows Server e Windows Azure.
Esse é um framework de aplicação que pode ser desenvolvido em clusters que rodam na nuvem ou em data centers privados. É mais provável que o Cascading 2.0 seja de interesse entre os programadores Java que mantêm olho fixo no Hadoop – mas pode também despertar o interesse dos membros da comunidade open source que compartilham conexões ou associação com o fundador da empresa Chris Wensel, autor do projeto de código aberto em para processamento de dados.
A empresa possui o Razorfish e o Twitter entre suas referências de clientes e diz que ambos usam a plataforma para otimizar o processamento de dados, filtragem de dados e otimização de fluxo de trabalho para grandes volumes de dados não estruturados e semiestruturados.
O Cascading é também o cerne de extensões de linguagem, incluindo PyCascading, Scalding, e Cascalog (projetos de código aberto patrocinado pelo Twitter) e ferramentas, incluindo o CloudFront LogAnalyzer (desenvolvido pela Amazon).
Cientistas de dados, administradores Hadoop e desenvolvedores de apps
De acordo com o blog da empresa, o framework do Cascading é projetado para cientistas, administradores de dados Hadoop, e desenvolvedores de aplicativos, já que eles colaboram, desenvolvem e implantam aplicações escaláveis de big data.
“Criar aplicativos em Hadoop, apesar da crescent adoção nas empresas, não é notoriamente difícil. Nós dividimos o futuro do desenvolvimento e do gerenciamento de aplicações na plataforma, ao permitir que as companhias extraiam rapidamente informações importantes de grandes quantidades de dados distribuídos e melhor entendimentos das implicações nos negócios. Facilitamos a criação de aplicações de processamento de dados poderosas para Hadoop, sem requerer meses gastos em aprendizado sobre os meandros do MapReduce”, afirmou Wensel.
Importante para os desenvolvedores de aplicativos aqui é a oportunidade de construir e testar aplicações em seus desktops com a linguagem de sua escolha (Java, Jython, Scala, Clojure, ou JRuby) com o que foi descrito como “construções familiares e componentes reutilizáveis” – isso, em teoria, lhes dá a capacidade de “instantaneamente” implantar seus apps em grupos de centenas de nodes.
“A Microsoft está comprometida com a compatibilidade com o Apache Hadoop para os nossos próximos serviços baseados no Windows Server e do Windows Azure”, disse Bob Baker, diretor e sócio do canal de marketing da Microsoft. “Em testes, O Cascading no Windows Server trabalhou diretamente fora da caixa e estamos certificando Cascading 2.0 no Windows Server para dar aos clientes uma forma flexível de desenvolvimento de aplicações big data para o Hadoop que lhes permite criar e implantar aplicativos para a plataforma em Windows Server e Windows Azure.
Fonte: ItWeb