Ephorus Fetch Federation
O projeto Ephorus Fetch Federation cria a federation of web spidering services , coordenados por um controlador centralizado. O projeto pode processar uma longa lista de sites e constrói um índice usando um número infinito de máquinas lógicas para recuperar ,analisar e indexar dados de texto. O controlador distribui a computação para várias máquinas, escolhendo aquelas que não estão trabalhando ativamente para iniciar o próximo nó que será buscado. O processo de busca de busca é auto-suficiente , além disso, o processo permite intervenção do operador, para instanciar dinamicamente e adicionar filtros. Em razão ao tamanho dos dados indexados, a persistência é completamente distribuída e usando ''noSQL'' . Esse projeto foi criado usando um núcleo java para reais worker services e API Servlet 2.5 / Jersey REST para o front-end. O controlador usa um serviço de Lookup baseado em multicast que foi usado da infra-estrutura Jini. No restante , todo o serviço interno de comunicação, incluindo iniciação e término, é feito usando API REST. Todos os dados e indexações são guardado com Hadoop, Hbase noSQL. Este entrou em produção na última semana de Junho de 2011.
Ephorus Teacher-UI
O Ephorus Teacher-UI é a interface para um professor monitorar o processo de detecção de plágios para documentos submetidos por estudantes. Este se conecta com um distribuído processo de pepiline de documentos. Devido ao grande número de documentos enviados e escaniados para plágios, o sistema usa uma técnica chamada de 'sharding': ele lida com milhões de uploads e downloads e distribui meta-dados dos documentos em vários servidores de banco de dados em uma maneira determinística e intuitiva. O projeto usa armazena em Cloud reais conteúdos de documentos. Além de ser uma interface de usuário web , ele gera relatórios PDF e estatísticas no formato Excel.
Este projeto for criado baseado na API Servlet 2.5, MySQL, uma modificada versão do JPA para suportar distribuição ( 'sharding' ), SQL puro para operações sensíveis a performance, WS-REST usando Jersey, e puro Javascript e Jquery. O projeto foi entregue como produto de desenvolvimento para o grupo Ephorus e para posteriores integrações com o pepiline da Ephorus para iniciar a migração e crescer o processo.
Componente de busca Ephorus
Este projeto é um simples e pequeno ATOM feed / OpenSearch compliant search aggregator . O projeto suporta o processo de detecção de falhas da Ephorus , pesquisando conteúdos usando diferentes engines de busca, sejam elas da própria empresa ou externas. O componente é uma simples aplicação web na API Servlet 2.5 usando praticamente nada de banco de dados. Para máximo controle, o componente controla todo o paralelismo sozinho e não atribui a nenhum tipo de container-supplied resource apart from the URL of the configuration. Ele inicia a configuração isolando detalhes de suas threads por cada engine de busca e essas engines é configurada pra rodar para mil threads cada.
A configuração pode ser gerenciada centralmente e mudanças são efetuadas com somente 10 segundos de espera sem reiniciar o serviço. Ele entrou em produção 21 de setembro de 2011.