Changeset 30384

Show
Ignore:
Timestamp:
02/21/08 01:07:42 (9 months ago)
Author:
tdelprat
Message:

NXP-2102
Add new text extractors based on JR

Files:

Legend:

Unmodified
Added
Removed
Modified
Copied
Moved
  • org.nuxeo.ecm.platform/branches/5.1/nuxeo-platform-transform-plugins/pom.xml

    r29737 r30384  
    1 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd"> 
     1<project xmlns="http://maven.apache.org/POM/4.0.0" 
     2  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     3  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd"> 
    24  <modelVersion>4.0.0</modelVersion> 
    35 
     
    1315  </name> 
    1416  <description> 
    15     Nuxeo Enterprise Platform: some default transformers for the Content 
    16     Transformation Service. This package provides: any-to-pdf using 
    17     OpenOffice.org as rendering engine, pdf-to-jpeg, pdf-to-text, 
    18     pdf-to-png, WordML metadata injection (inject document metadata into 
    19     a WordML file), any-to-odt / any-to-ods / any-to-odp (transform any 
    20     file format supported by OpenOffice.org into ODF). 
     17    Nuxeo Enterprise Platform: some default transformers for the 
     18    Content Transformation Service. This package provides: 
     19    any-to-pdf using OpenOffice.org as rendering engine, 
     20    pdf-to-jpeg, pdf-to-text, pdf-to-png, WordML metadata injection 
     21    (inject document metadata into a WordML file), any-to-odt / 
     22    any-to-ods / any-to-odp (transform any file format supported by 
     23    OpenOffice.org into ODF). 
    2124  </description> 
    2225 
     
    6770    </dependency> 
    6871    <dependency> 
    69       <groupId>poi</groupId> 
     72      <groupId>org.apache.poi</groupId> 
    7073      <artifactId>poi</artifactId> 
    71       <version>3.0-alpha3</version> 
    72     </dependency> 
    73  
     74      <version>3.0.2-FINAL</version> 
     75    </dependency> 
     76    <dependency> 
     77      <groupId>org.apache.poi</groupId> 
     78      <artifactId>poi-scratchpad</artifactId> 
     79      <version>3.0.2-FINAL</version> 
     80    </dependency> 
     81    <dependency> 
     82      <groupId>org.apache.jackrabbit</groupId> 
     83      <artifactId>jackrabbit-text-extractors</artifactId> 
     84      <version>1.3.3</version> 
     85    </dependency> 
    7486    <dependency> 
    7587      <groupId>org.nuxeo.runtime</groupId> 
     
    102114            <exclude>**/TestAny*.class</exclude> 
    103115            <exclude>**/TestJOO*.class</exclude> 
    104             <exclude>**/MultipleResultsEchoPlugin*.class</exclude> 
     116            <exclude> 
     117              **/MultipleResultsEchoPlugin*.class 
     118            </exclude> 
    105119            <exclude>**/AbstractXSLT*.class</exclude> 
    106120          </excludes> 
     
    122136                <artifactItem> 
    123137                  <groupId>commons-logging</groupId> 
    124                   <artifactId>commons-logging-api</artifactId> 
     138                  <artifactId> 
     139                    commons-logging-api 
     140                  </artifactId> 
    125141                </artifactItem> 
    126142                <artifactItem> 
     
    130146                <artifactItem> 
    131147                  <groupId>com.artofsolving</groupId> 
    132                   <artifactId>jodconverter</artifactId> 
     148                  <artifactId> 
     149                    jodconverter 
     150                  </artifactId> 
    133151                </artifactItem> 
    134152                <artifactItem> 
     
    158176                </artifactItem> 
    159177                <artifactItem> 
    160                   <groupId>com.thoughtworks.xstream</groupId> 
     178                  <groupId> 
     179                    com.thoughtworks.xstream 
     180                  </groupId> 
    161181                  <artifactId>xstream</artifactId> 
    162182                </artifactItem> 
    163183                <artifactItem> 
    164                   <groupId>poi</groupId> 
     184                  <groupId>org.apache.poi</groupId> 
    165185                  <artifactId>poi</artifactId> 
    166186                </artifactItem> 
     187                <artifactItem> 
     188                  <groupId> 
     189                    org.apache.jackrabbit 
     190                  </groupId> 
     191                  <artifactId> 
     192                    jackrabbit-text-extractors 
     193                  </artifactId> 
     194                </artifactItem> 
     195 
    167196              </artifactItems> 
    168197              <outputDirectory> 
  • org.nuxeo.ecm.platform/branches/5.1/nuxeo-platform-transform-plugins/src/main/resources/OSGI-INF/nxtransform-plugins-contrib.xml

    r29938 r30384  
    55    Default transformation plugins and transform chains. 
    66 
    7     @version 1.0 
    8     @author <a href="mailto:ja@nuxeo.com">Julien Anguenot</a> 
     7    @version 1.0 @author 
     8    <a href="mailto:ja@nuxeo.com">Julien Anguenot</a> 
    99  </documentation> 
    1010 
     
    3030      <!-- Microsoft office documents --> 
    3131      <sourceMimeType>application/msword</sourceMimeType> 
    32       <sourceMimeType>application/vnd.ms-powerpoint</sourceMimeType> 
     32      <sourceMimeType> 
     33        application/vnd.ms-powerpoint 
     34      </sourceMimeType> 
    3335      <sourceMimeType>application/vnd.ms-excel</sourceMimeType> 
    3436 
    3537      <!-- OpenOffice.org 1.x documents --> 
    36       <sourceMimeType>application/vnd.sun.xml.writer</sourceMimeType> 
     38      <sourceMimeType> 
     39        application/vnd.sun.xml.writer 
     40      </sourceMimeType> 
    3741      <sourceMimeType> 
    3842        application/vnd.sun.xml.writer.template 
    3943      </sourceMimeType> 
    40       <sourceMimeType>application/vnd.sun.xml.impress</sourceMimeType> 
     44      <sourceMimeType> 
     45        application/vnd.sun.xml.impress 
     46      </sourceMimeType> 
    4147      <sourceMimeType> 
    4248        application/vnd.sun.xml.impress.template 
    4349      </sourceMimeType> 
    44       <sourceMimeType>application/vnd.sun.xml.calc</sourceMimeType> 
     50      <sourceMimeType> 
     51        application/vnd.sun.xml.calc 
     52      </sourceMimeType> 
    4553      <sourceMimeType> 
    4654        application/vnd.sun.xml.calc.template 
    4755      </sourceMimeType> 
    48       <sourceMimeType>application/vnd.sun.xml.draw</sourceMimeType> 
     56      <sourceMimeType> 
     57        application/vnd.sun.xml.draw 
     58      </sourceMimeType> 
    4959      <sourceMimeType> 
    5060        application/vnd.sun.xml.draw.template 
     
    135145 
    136146      <!-- OpenOffice.org 1.x documents --> 
    137       <sourceMimeType>application/vnd.sun.xml.writer</sourceMimeType> 
     147      <sourceMimeType> 
     148        application/vnd.sun.xml.writer 
     149      </sourceMimeType> 
    138150      <sourceMimeType> 
    139151        application/vnd.sun.xml.writer.template 
     
    165177      <sourceMimeType>application/vnd.ms-excel</sourceMimeType> 
    166178      <!-- OpenOffice.org 1.x documents --> 
    167       <sourceMimeType>application/vnd.sun.xml.calc</sourceMimeType> 
     179      <sourceMimeType> 
     180        application/vnd.sun.xml.calc 
     181      </sourceMimeType> 
    168182      <sourceMimeType> 
    169183        application/vnd.sun.xml.calc.template 
     
    192206 
    193207      <!-- Microsoft office documents --> 
    194       <sourceMimeType>application/vnd.ms-powerpoint</sourceMimeType> 
     208      <sourceMimeType> 
     209        application/vnd.ms-powerpoint 
     210      </sourceMimeType> 
    195211      <!-- OpenOffice.org 1.x documents --> 
    196       <sourceMimeType>application/vnd.sun.xml.impress</sourceMimeType> 
     212      <sourceMimeType> 
     213        application/vnd.sun.xml.impress 
     214      </sourceMimeType> 
    197215      <sourceMimeType> 
    198216        application/vnd.sun.xml.impress.template 
     
    217235    <plugin name="word2text_poi" 
    218236      class="org.nuxeo.ecm.platform.transform.plugin.poi.WordToTextPlugin" 
    219       destinationMimeType="plain/text"> 
     237      destinationMimeType="text/plain"> 
    220238      <sourceMimeType>application/msword</sourceMimeType> 
    221239    </plugin> 
     
    223241    <plugin name="ppt2text_poi" 
    224242      class="org.nuxeo.ecm.platform.transform.plugin.poi.PowerpointToTextPlugin" 
    225       destinationMimeType="plain/text"> 
    226       <sourceMimeType>application/vnd.ms-powerpoint</sourceMimeType> 
    227     </plugin> 
     243      destinationMimeType="text/plain"> 
     244      <sourceMimeType> 
     245        application/vnd.ms-powerpoint 
     246      </sourceMimeType> 
     247    </plugin> 
     248 
     249    <plugin name="xl2text_jr" 
     250      class="org.nuxeo.ecm.platform.transform.plugin.jr.ExcelToTextPlugin" 
     251      destinationMimeType="text/plain"> 
     252      <sourceMimeType> 
     253        application/vnd.ms-excel 
     254      </sourceMimeType> 
     255    </plugin> 
     256 
     257    <plugin name="xml2text_jr" 
     258      class="org.nuxeo.ecm.platform.transform.plugin.jr.XMLToTextPlugin" 
     259      destinationMimeType="text/plain"> 
     260      <sourceMimeType> 
     261        text/xml 
     262      </sourceMimeType> 
     263    </plugin> 
     264 
     265    <plugin name="html2text_jr" 
     266      class="org.nuxeo.ecm.platform.transform.plugin.jr.HtmlToTextPlugin" 
     267      destinationMimeType="text/plain"> 
     268      <sourceMimeType> 
     269        text/html 
     270      </sourceMimeType> 
     271    </plugin> 
     272 
     273    <plugin name="oo2text_jr" 
     274      class="org.nuxeo.ecm.platform.transform.plugin.jr.OOoSimpleTextExtractor" 
     275      destinationMimeType="text/plain"> 
     276      <sourceMimeType> 
     277        application/vnd.sun.xml.impress 
     278      </sourceMimeType> 
     279      <sourceMimeType> 
     280        application/vnd.sun.xml.impress.template 
     281      </sourceMimeType> 
     282      <sourceMimeType> 
     283        application/vnd.oasis.opendocument.presentation 
     284      </sourceMimeType> 
     285      <sourceMimeType> 
     286        application/vnd.oasis.opendocument.presentation-template 
     287      </sourceMimeType> 
     288      <sourceMimeType> 
     289        application/vnd.sun.xml.calc 
     290      </sourceMimeType> 
     291      <sourceMimeType> 
     292        application/vnd.sun.xml.calc.template 
     293      </sourceMimeType> 
     294      <sourceMimeType> 
     295        application/vnd.oasis.opendocument.spreadsheet 
     296      </sourceMimeType> 
     297      <sourceMimeType> 
     298        application/vnd.oasis.opendocument.spreadsheet-template 
     299      </sourceMimeType> 
     300      <sourceMimeType> 
     301        application/vnd.sun.xml.writer 
     302      </sourceMimeType> 
     303      <sourceMimeType> 
     304        application/vnd.sun.xml.writer.template 
     305      </sourceMimeType> 
     306      <sourceMimeType> 
     307        application/vnd.oasis.opendocument.text 
     308      </sourceMimeType> 
     309      <sourceMimeType> 
     310        application/vnd.oasis.opendocument.text-template 
     311      </sourceMimeType> 
     312    </plugin> 
     313 
    228314 
    229315    <!-- This plugin transforms XML documents using a XSL stylesheet --> 
     
    247333    point="transformers"> 
    248334 
    249     <documentation>Set of default transformation chains.</documentation> 
     335    <documentation> 
     336      Set of default transformation chains. 
     337    </documentation> 
    250338 
    251339    <!-- This transformer uses a the OOo plugin to transform documents to pdf--> 
  • org.nuxeo.ecm.platform/branches/5.1/nuxeo-platform-transform-plugins/src/test/resources/nxtransform-plugins-bundle.xml

    r29938 r30384  
    162162    <plugin name="word2text_poi" 
    163163      class="org.nuxeo.ecm.platform.transform.plugin.poi.WordToTextPlugin" 
    164       destinationMimeType="plain/text"> 
     164      destinationMimeType="text/plain"> 
    165165      <sourceMimeType>application/msword</sourceMimeType> 
    166166    </plugin> 
     
    168168    <plugin name="ppt2text_poi" 
    169169      class="org.nuxeo.ecm.platform.transform.plugin.poi.PowerpointToTextPlugin" 
    170       destinationMimeType="plain/text"> 
     170      destinationMimeType="text/plain"> 
    171171      <sourceMimeType> 
    172172        application/vnd.ms-powerpoint 
     173      </sourceMimeType> 
     174    </plugin> 
     175 
     176    <plugin name="xl2text_jr" 
     177      class="org.nuxeo.ecm.platform.transform.plugin.jr.ExcelToTextPlugin" 
     178      destinationMimeType="text/plain"> 
     179      <sourceMimeType> 
     180        application/vnd.ms-excel 
     181      </sourceMimeType> 
     182    </plugin> 
     183 
     184    <plugin name="xml2text_jr" 
     185      class="org.nuxeo.ecm.platform.transform.plugin.jr.XMLToTextPlugin" 
     186      destinationMimeType="text/plain"> 
     187      <sourceMimeType> 
     188        text/xml 
     189      </sourceMimeType> 
     190    </plugin> 
     191 
     192    <plugin name="html2text_jr" 
     193      class="org.nuxeo.ecm.platform.transform.plugin.jr.HtmlToTextPlugin" 
     194      destinationMimeType="text/plain"> 
     195      <sourceMimeType> 
     196        text/html 
     197      </sourceMimeType> 
     198    </plugin> 
     199 
     200    <plugin name="oo2text_jr" 
     201      class="org.nuxeo.ecm.platform.transform.plugin.jr.OOoSimpleTextExtractor" 
     202      destinationMimeType="text/plain"> 
     203      <sourceMimeType> 
     204        application/vnd.sun.xml.impress 
     205      </sourceMimeType> 
     206      <sourceMimeType> 
     207        application/vnd.sun.xml.impress.template 
     208      </sourceMimeType> 
     209      <sourceMimeType> 
     210        application/vnd.oasis.opendocument.presentation 
     211      </sourceMimeType> 
     212      <sourceMimeType> 
     213        application/vnd.oasis.opendocument.presentation-template 
     214      </sourceMimeType> 
     215      <sourceMimeType> 
     216        application/vnd.sun.xml.calc 
     217      </sourceMimeType> 
     218      <sourceMimeType> 
     219        application/vnd.sun.xml.calc.template 
     220      </sourceMimeType> 
     221      <sourceMimeType> 
     222        application/vnd.oasis.opendocument.spreadsheet 
     223      </sourceMimeType> 
     224      <sourceMimeType> 
     225        application/vnd.oasis.opendocument.spreadsheet-template 
     226      </sourceMimeType> 
     227      <sourceMimeType> 
     228        application/vnd.sun.xml.writer 
     229      </sourceMimeType> 
     230      <sourceMimeType> 
     231        application/vnd.sun.xml.writer.template 
     232      </sourceMimeType> 
     233      <sourceMimeType> 
     234        application/vnd.oasis.opendocument.text 
     235      </sourceMimeType> 
     236      <sourceMimeType> 
     237        application/vnd.oasis.opendocument.text-template 
    173238      </sourceMimeType> 
    174239    </plugin>