root / pkpgcounter / trunk / pkpgpdls / pclxl.py @ 316

Revision 316, 29.4 kB (checked in by jerome, 18 years ago)

Simplified the PCLXL parser. This gives a 10% speedup.

  • Property svn:eol-style set to native
  • Property svn:keywords set to Auth Date Id Rev
RevLine 
[193]1#! /usr/bin/env python
2# -*- coding: ISO-8859-15 -*-
[191]3#
4# pkpgcounter : a generic Page Description Language parser
5#
[302]6# (c) 2003, 2004, 2005, 2006 Jerome Alet <alet@librelogiciel.com>
[191]7# This program is free software; you can redistribute it and/or modify
8# it under the terms of the GNU General Public License as published by
9# the Free Software Foundation; either version 2 of the License, or
10# (at your option) any later version.
11#
12# This program is distributed in the hope that it will be useful,
13# but WITHOUT ANY WARRANTY; without even the implied warranty of
14# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15# GNU General Public License for more details.
16#
17# You should have received a copy of the GNU General Public License
18# along with this program; if not, write to the Free Software
[211]19# Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
[191]20#
21# $Id$
22#
[193]23
24import sys
[202]25import os
[193]26import mmap
27from struct import unpack
28
[235]29import pdlparser
[252]30import pjl
[193]31
[220]32class Parser(pdlparser.PDLParser) :
[193]33    """A parser for PCLXL (aka PCL6) documents."""
34    mediasizes = { 
35                    0 : "Letter",
36                    1 : "Legal",
37                    2 : "A4",
38                    3 : "Executive",
39                    4 : "Ledger",
40                    5 : "A3",
41                    6 : "COM10Envelope",
42                    7 : "MonarchEnvelope",
43                    8 : "C5Envelope",
44                    9 : "DLEnvelope",
45                    10 : "JB4",
46                    11 : "JB5",
47                    12 : "B5Envelope",
[246]48                    12 : "B5",
[193]49                    14 : "JPostcard",
50                    15 : "JDoublePostcard",
51                    16 : "A5",
52                    17 : "A6",
53                    18 : "JB6",
[246]54                    19 : "JIS8K",
55                    20 : "JIS16K",
56                    21 : "JISExec",
57                    96 : "Default",
[193]58                 }   
59                 
60    mediasources = {             
61                     0 : "Default",
62                     1 : "Auto",
63                     2 : "Manual",
64                     3 : "MultiPurpose",
65                     4 : "UpperCassette",
66                     5 : "LowerCassette",
67                     6 : "EnvelopeTray",
68                     7 : "ThirdCassette",
69                   }
70                   
71    orientations = {               
72                     0 : "Portrait",
73                     1 : "Landscape",
74                     2 : "ReversePortrait",
75                     3 : "ReverseLandscape",
[246]76                     4 : "Default",
[193]77                   }
78           
[220]79    def isValid(self) :   
80        """Returns 1 if data is PCLXL aka PCL6, else 0."""
81        if ((self.firstblock[:128].find("\033%-12345X") != -1) and \
82             (self.firstblock.find(" HP-PCL XL;") != -1) and \
83             ((self.firstblock.find("LANGUAGE=PCLXL") != -1) or \
84              (self.firstblock.find("LANGUAGE = PCLXL") != -1))) :
[252]85            self.logdebug("DEBUG: Input file is in the PCLXL (aka PCL6) format.")
[220]86            return 1
87        else :   
88            return 0
89           
[316]90    def beginPage(self, prevpos) :
[193]91        """Indicates the beginning of a new page, and extracts media information."""
92        self.pagecount += 1
93       
94        # Default values
95        mediatypelabel = "Plain"
96        mediasourcelabel = "Main"
97        mediasizelabel = "Default"
98        orientationlabel = "Portrait"
[299]99        duplexmode = None
[193]100       
101        # Now go upstream to decode media type, size, source, and orientation
102        # this saves time because we don't need a complete parser !
103        minfile = self.minfile
[316]104        pos = prevpos - 2
[193]105        while pos > 0 : # safety check : don't go back to far !
106            val = ord(minfile[pos])
107            if val in (0x44, 0x48, 0x41) : # if previous endPage or openDataSource or beginSession (first page)
108                break
109            if val == 0x26 :   
110                mediasource = ord(minfile[pos - 2])
111                mediasourcelabel = self.mediasources.get(mediasource, str(mediasource))
[302]112                pos -= 4
[193]113            elif val == 0x25 :
[302]114                while (pos > 0) and (ord(minfile[pos]) != 0xc0) :
115                    # we search the preceding ubyte tag
116                    pos -= 1
117                if pos > 0 :
118                    if ord(minfile[pos-1]) == 0xc8 :
119                        # if we found an ubyte_array then the media
120                        # size is completely spelled
121                        arraylength = ord(minfile[pos+1])
122                        mediasizelabel = minfile[pos+2:pos+2+arraylength].title()
123                        pos -= 1
124                    else :   
125                        # if we just found an ubyte, then the media
126                        # size is known by its index
127                        mediasize = ord(minfile[pos+1])
128                        mediasizelabel = self.mediasizes.get(mediasize, str(mediasize))
129                    pos -= 1 
[310]130                    # self.logdebug("Media size : %s" % mediasizelabel)
[193]131            elif val == 0x28 :   
132                orientation = ord(minfile[pos - 2])
[252]133                orientationlabel = self.orientations.get(orientation, str(orientation))
[302]134                pos -= 4
[193]135            elif val == 0x27 :   
136                savepos = pos
[302]137                pos -= 1
[293]138                startpos = size = None 
[193]139                while pos > 0 : # safety check : don't go back to far !
140                    val = ord(minfile[pos])
141                    pos -= 1   
142                    if val == 0xc8 :
[293]143                        length = self.tags[ord(minfile[pos+2])] # will probably always be a byte or uint16
144                        if length == 1 :   
145                            startpos = pos + 4
146                            size = unpack("B", self.minfile[pos+3:startpos])[0]
147                        elif length == 2 :   
148                            startpos = pos + 5
[316]149                            size = unpack(self.unpackShort, self.minfile[pos+3:startpos])[0]
[293]150                        elif length == 4 :   
151                            startpos = pos + 7
[316]152                            size = unpack(self.unpackLong, self.minfile[pos+3:startpos])[0]
[293]153                        else :   
[301]154                            raise pdlparser.PDLParserError, "Error on size at %s : %s" % (pos+2, length)
[193]155                        break
[293]156                mediatypelabel = minfile[startpos:startpos+size]
[310]157                # self.logdebug("Media type : %s" % mediatypelabel)
[299]158            elif val == 0x34 :   
159                duplexmode = "Simplex"
[302]160                pos -= 2
[299]161            elif val in (0x35, 0x36) :   
162                duplexmode = "Duplex"
[302]163                pos -= 2
[193]164            # else : TODO : CUSTOM MEDIA SIZE AND UNIT !
165            else :   
[302]166                pos -= 1  # ignored
[193]167        self.pages[self.pagecount] = { "copies" : 1, 
168                                       "orientation" : orientationlabel, 
169                                       "mediatype" : mediatypelabel, 
170                                       "mediasize" : mediasizelabel,
171                                       "mediasource" : mediasourcelabel,
[299]172                                       "duplex" : duplexmode,
[193]173                                     } 
174        return 0
175       
[316]176    def endPage(self, prevpos) :   
[193]177        """Indicates the end of a page."""
[316]178        pos = prevpos
[206]179        pos3 = pos - 3
[193]180        minfile = self.minfile
[206]181        if minfile[pos3:pos-1] == self.setNumberOfCopies :
[193]182            # The EndPage operator may be preceded by a PageCopies attribute
183            # So set number of copies for current page.
184            # From what I read in PCLXL documentation, the number
185            # of copies is an unsigned 16 bits integer
[258]186            try :
[316]187                self.pages[self.pagecount]["copies"] = unpack(self.unpackShort, minfile[pos-5:pos3])[0]
[258]188            except KeyError :   
189                self.logdebug("It looks like this PCLXL file is corrupted.")
[193]190        return 0
191       
[316]192    def setColorSpace(self, prevpos) :   
[205]193        """Changes the color space."""
[316]194        if self.minfile[prevpos-4:prevpos-1] == self.RGBColorSpace :
[206]195            self.iscolor = 1
[205]196        return 0
197           
[316]198    def array_8(self, prevpos) :   
[193]199        """Handles byte arrays."""
[316]200        pos = prevpos
[193]201        datatype = self.minfile[pos]
202        pos += 1
203        length = self.tags[ord(datatype)]
204        if callable(length) :
[316]205            length = length(pos)
[193]206        posl = pos + length
207        if length == 1 :   
[316]208            return 1 + length + unpack("B", self.minfile[pos:posl])[0]
[193]209        elif length == 2 :   
[316]210            return 1 + length + unpack(self.unpackShort, self.minfile[pos:posl])[0]
[193]211        elif length == 4 :   
[316]212            return 1 + length + unpack(self.unpackLong, self.minfile[pos:posl])[0]
[193]213        else :   
[316]214            raise pdlparser.PDLParserError, "Error on array size at %x" % prevpos
[193]215       
[316]216    def array_16(self, prevpos) :
[193]217        """Handles byte arrays."""
[316]218        pos = prevpos
[193]219        datatype = self.minfile[pos]
220        pos += 1
221        length = self.tags[ord(datatype)]
222        if callable(length) :
[316]223            length = length(pos)
[193]224        posl = pos + length
225        if length == 1 :   
[316]226            return 1 + length + 2 * unpack("B", self.minfile[pos:posl])[0]
[193]227        elif length == 2 :   
[316]228            return 1 + length + 2 * unpack(self.unpackShort, self.minfile[pos:posl])[0]
[193]229        elif length == 4 :   
[316]230            return 1 + length + 2 * unpack(self.unpackLong, self.minfile[pos:posl])[0]
[193]231        else :   
[316]232            raise pdlparser.PDLParserError, "Error on array size at %x" % prevpos
[193]233       
[316]234    def array_32(self, prevpos) :
[193]235        """Handles byte arrays."""
[316]236        pos = prevpos
[193]237        datatype = self.minfile[pos]
238        pos += 1
239        length = self.tags[ord(datatype)]
240        if callable(length) :
[316]241            length = length(pos)
[193]242        posl = pos + length
243        if length == 1 :   
[316]244            return 1 + length + 4 * unpack("B", self.minfile[pos:posl])[0]
[193]245        elif length == 2 :   
[316]246            return 1 + length + 4 * unpack(self.unpackShort, self.minfile[pos:posl])[0]
[193]247        elif length == 4 :   
[316]248            return 1 + length + 4 * unpack(self.unpackLong, self.minfile[pos:posl])[0]
[193]249        else :   
[316]250            raise pdlparser.PDLParserError, "Error on array size at %x" % prevpos
[193]251       
[316]252    def embeddedDataSmall(self, prevpos) :
[193]253        """Handle small amounts of data."""
[316]254        return 1 + ord(self.minfile[prevpos])
[193]255       
[316]256    def embeddedData(self, prevpos) :
[193]257        """Handle normal amounts of data."""
[316]258        return 4 + unpack(self.unpackLong, self.minfile[prevpos:prevpos+4])[0]
[193]259       
[316]260    def littleEndian(self, prevpos) :
[193]261        """Toggles to little endianness."""
262        self.endianness = "<" # little endian
[316]263        self.unpackShort = "<H"
264        self.unpackLong = "<I"
[193]265        return 0
266       
[316]267    def bigEndian(self, prevpos) :
[193]268        """Toggles to big endianness."""
269        self.endianness = ">" # big endian
[316]270        self.unpackShort = ">H"
271        self.unpackLong = ">I"
[193]272        return 0
273   
[316]274    def reservedForFutureUse(self, prevpos) :
[245]275        """Outputs something when a reserved byte is encountered."""
[316]276        self.logdebug("Byte at %x is out of the PCLXL Protocol Class 2.0 Specification" % prevpos)
[245]277        return 0   
278       
[316]279    def x46_class3(self, prevpos) :
[310]280        """Undocumented tag 0x46 in class 3.0 streams."""
[316]281        pos = prevpos
[309]282        minfile = self.minfile
283        while pos > 0 : # safety check : don't go back to far !
284            val = ord(minfile[pos])
285            if (val == 0xf8) and (ord(minfile[pos+1]) in (0x95, 0x96)) :
286                pos += 2
[310]287                ordatatype = ord(self.minfile[pos])
288                if ordatatype == 0x46 :
[309]289                    break
290                pos += 1
[310]291                length = self.tags[ordatatype]
[309]292                posl = pos + length
293                if length == 1 :   
[310]294                    return unpack("B", self.minfile[pos:posl])[0]
[309]295                elif length == 2 :   
[316]296                    return unpack(self.unpackShort, self.minfile[pos:posl])[0]
[309]297                elif length == 4 :   
[316]298                    return unpack(self.unpackLong, self.minfile[pos:posl])[0]
[309]299                else :   
[316]300                    raise pdlparser.PDLParserError, "Error on size at %x" % prevpos
[309]301            else :   
[312]302                pos -= 1
[309]303        return 0   
304       
[316]305    def escape(self, prevpos) :   
[245]306        """Handles the ESC code."""
[316]307        pos = endpos = prevpos
[314]308        minfile = self.minfile
309        if minfile[pos : pos+8] == r"%-12345X" :
[245]310            endpos = pos + 9
[252]311            endmark = chr(0x0c) + chr(0x00) + chr(0x1b)
[246]312            asciilimit = chr(0x80)
[269]313            quotes = 0
[314]314            while (minfile[endpos] not in endmark) and \
315                   ((minfile[endpos] < asciilimit) or (quotes % 2)) :
316                if minfile[endpos] == '"' :
[269]317                    quotes += 1
[245]318                endpos += 1
319               
320            # Store this in a per page mapping.   
321            # NB : First time will be at page 0 (i.e. **before** page 1) !
322            stuff = self.escapedStuff.setdefault(self.pagecount, [])
[314]323            stuff.append(minfile[pos : endpos])
324            self.logdebug("Escaped datas : [%s]" % repr(minfile[pos : endpos]))
[245]325        return endpos - pos
326       
[316]327    def skipKyoceraPrescribe(self, prevpos) :
[312]328        """Skips Kyocera Prescribe commands."""
[316]329        pos = prevpos - 1
[312]330        minfile = self.minfile
331        if minfile[pos:pos+3] == "!R!" :
[316]332            while (pos - prevpos) < 1024 :   # This is a realistic upper bound, to avoid infinite loops
[312]333                if (minfile[pos] == ";") and (minfile[pos-4:pos] == "EXIT") :
[314]334                    pos += 1
335                    prescribe = self.prescribeStuff.setdefault(self.pagecount, [])
[316]336                    prescribe.append(minfile[prevpos-1:pos])
337                    self.logdebug("Prescribe commands : [%s]" % repr(minfile[prevpos-1:pos]))
338                    return (pos - prevpos)
[312]339                pos += 1   
340        else :
341            return 0
342           
[193]343    def getJobSize(self) :
344        """Counts pages in a PCLXL (PCL6) document.
345       
346           Algorithm by Jerome Alet.
347           
348           The documentation used for this was :
349         
350           HP PCL XL Feature Reference
351           Protocol Class 2.0
352           http://www.hpdevelopersolutions.com/downloads/64/358/xl_ref20r22.pdf
[246]353           
354           Protocol Class 2.1 Supplement
355           xl_ref21.pdf
356           
357           Protocol Class 3.0 Supplement
358           xl_refsup30r089.pdf
[193]359        """
[206]360        self.iscolor = None
[193]361        self.endianness = None
362        found = 0
363        while not found :
364            line = self.infile.readline()
365            if not line :
366                break
[293]367            pos = line.find(" HP-PCL XL;")   
368            if pos != -1 :
[193]369                found = 1
[293]370                endian = ord(line[pos - 1])
[193]371                if endian == 0x29 :
[316]372                    self.littleEndian(0)
[193]373                elif endian == 0x28 :   
[316]374                    self.bigEndian(0)
[193]375                # elif endian == 0x27 : # TODO : This is the ESC code : parse it for PJL statements !
376                #
377                else :   
[200]378                    raise pdlparser.PDLParserError, "Unknown endianness marker 0x%02x at start !" % endian
[193]379        if not found :
[200]380            raise pdlparser.PDLParserError, "This file doesn't seem to be PCLXL (aka PCL6)"
[193]381           
[246]382        # Initialize Media Sources
383        for i in range(8, 256) :
384            self.mediasources[i] = "ExternalTray%03i" % (i - 7)
385           
[193]386        # Initialize table of tags
387        self.tags = [ 0 ] * 256   
388       
[245]389        self.tags[0x1b] = self.escape # The escape code
390       
[313]391        self.tags[0x21]= self.skipKyoceraPrescribe # 0x21 is not normally used
[312]392       
[193]393        # GhostScript's sources tell us that HP printers
394        # only accept little endianness, but we can handle both.
395        self.tags[0x28] = self.bigEndian    # BigEndian
396        self.tags[0x29] = self.littleEndian # LittleEndian
397       
398        self.tags[0x43] = self.beginPage    # BeginPage
399        self.tags[0x44] = self.endPage      # EndPage
[245]400        self.tags[0x45] = self.reservedForFutureUse # reserved
[313]401       
[309]402        self.tags[0x46] = self.x46_class3 
[193]403       
[245]404        self.tags[0x4a] = self.reservedForFutureUse # reserved
405        self.tags[0x4b] = self.reservedForFutureUse # reserved
406        self.tags[0x4c] = self.reservedForFutureUse # reserved
407        self.tags[0x4d] = self.reservedForFutureUse # reserved
408        self.tags[0x4e] = self.reservedForFutureUse # reserved
409       
410        self.tags[0x56] = self.reservedForFutureUse # TODO : documentation not clear about reserved status
411       
412        self.tags[0x57] = self.reservedForFutureUse # reserved
[313]413       
[245]414        self.tags[0x59] = self.reservedForFutureUse # reserved
415        self.tags[0x5a] = self.reservedForFutureUse # reserved
416       
[206]417        self.tags[0x6a] = self.setColorSpace    # to detect color/b&w mode
[205]418       
[245]419        self.tags[0x87] = self.reservedForFutureUse # reserved
420        self.tags[0x88] = self.reservedForFutureUse # reserved
421        self.tags[0x89] = self.reservedForFutureUse # reserved
422        self.tags[0x8a] = self.reservedForFutureUse # reserved
[313]423       
[245]424        self.tags[0x8b] = self.reservedForFutureUse # reserved
[313]425       
[245]426        self.tags[0x8c] = self.reservedForFutureUse # reserved
427        self.tags[0x8d] = self.reservedForFutureUse # reserved
428        self.tags[0x8e] = self.reservedForFutureUse # reserved
429        self.tags[0x8f] = self.reservedForFutureUse # reserved
430        self.tags[0x90] = self.reservedForFutureUse # reserved
431       
432        self.tags[0x9a] = self.reservedForFutureUse # reserved
433        self.tags[0x9c] = self.reservedForFutureUse # reserved
434       
435        self.tags[0xa4] = self.reservedForFutureUse # reserved
436        self.tags[0xa5] = self.reservedForFutureUse # reserved
437        self.tags[0xa6] = self.reservedForFutureUse # reserved
438        self.tags[0xa7] = self.reservedForFutureUse # reserved
439       
440        self.tags[0xaa] = self.reservedForFutureUse # reserved
441        self.tags[0xab] = self.reservedForFutureUse # reserved
442        self.tags[0xac] = self.reservedForFutureUse # reserved
443        self.tags[0xad] = self.reservedForFutureUse # reserved
444        self.tags[0xae] = self.reservedForFutureUse # reserved
445        self.tags[0xaf] = self.reservedForFutureUse # reserved
446       
447        self.tags[0xb7] = self.reservedForFutureUse # reserved
448       
449        self.tags[0xba] = self.reservedForFutureUse # reserved
450        self.tags[0xbb] = self.reservedForFutureUse # reserved
451        self.tags[0xbc] = self.reservedForFutureUse # reserved
452        self.tags[0xbd] = self.reservedForFutureUse # reserved
453        self.tags[0xbe] = self.reservedForFutureUse # reserved
454       
[316]455        # self.tags[0xbf] = self.passThrough # PassThrough mode should already be taken care of automatically
[298]456       
[193]457        self.tags[0xc0] = 1 # ubyte
458        self.tags[0xc1] = 2 # uint16
459        self.tags[0xc2] = 4 # uint32
460        self.tags[0xc3] = 2 # sint16
461        self.tags[0xc4] = 4 # sint32
462        self.tags[0xc5] = 4 # real32
463       
[245]464        self.tags[0xc6] = self.reservedForFutureUse # reserved
465        self.tags[0xc7] = self.reservedForFutureUse # reserved
466       
[193]467        self.tags[0xc8] = self.array_8  # ubyte_array
468        self.tags[0xc9] = self.array_16 # uint16_array
469        self.tags[0xca] = self.array_32 # uint32_array
470        self.tags[0xcb] = self.array_16 # sint16_array
471        self.tags[0xcc] = self.array_32 # sint32_array
472        self.tags[0xcd] = self.array_32 # real32_array
473       
[245]474        self.tags[0xce] = self.reservedForFutureUse # reserved
475        self.tags[0xcf] = self.reservedForFutureUse # reserved
476       
[193]477        self.tags[0xd0] = 2 # ubyte_xy
478        self.tags[0xd1] = 4 # uint16_xy
479        self.tags[0xd2] = 8 # uint32_xy
480        self.tags[0xd3] = 4 # sint16_xy
481        self.tags[0xd4] = 8 # sint32_xy
482        self.tags[0xd5] = 8 # real32_xy
[245]483        self.tags[0xd6] = self.reservedForFutureUse # reserved
484        self.tags[0xd7] = self.reservedForFutureUse # reserved
485        self.tags[0xd8] = self.reservedForFutureUse # reserved
486        self.tags[0xd9] = self.reservedForFutureUse # reserved
487        self.tags[0xda] = self.reservedForFutureUse # reserved
488        self.tags[0xdb] = self.reservedForFutureUse # reserved
489        self.tags[0xdc] = self.reservedForFutureUse # reserved
490        self.tags[0xdd] = self.reservedForFutureUse # reserved
491        self.tags[0xde] = self.reservedForFutureUse # reserved
492        self.tags[0xdf] = self.reservedForFutureUse # reserved
[193]493       
494        self.tags[0xe0] = 4  # ubyte_box
495        self.tags[0xe1] = 8  # uint16_box
496        self.tags[0xe2] = 16 # uint32_box
497        self.tags[0xe3] = 8  # sint16_box
498        self.tags[0xe4] = 16 # sint32_box
499        self.tags[0xe5] = 16 # real32_box
[245]500        self.tags[0xe6] = self.reservedForFutureUse # reserved
501        self.tags[0xe7] = self.reservedForFutureUse # reserved
502        self.tags[0xe8] = self.reservedForFutureUse # reserved
503        self.tags[0xe9] = self.reservedForFutureUse # reserved
504        self.tags[0xea] = self.reservedForFutureUse # reserved
505        self.tags[0xeb] = self.reservedForFutureUse # reserved
506        self.tags[0xec] = self.reservedForFutureUse # reserved
507        self.tags[0xed] = self.reservedForFutureUse # reserved
508        self.tags[0xee] = self.reservedForFutureUse # reserved
509        self.tags[0xef] = self.reservedForFutureUse # reserved
[193]510       
[245]511        self.tags[0xf0] = self.reservedForFutureUse # reserved
512        self.tags[0xf1] = self.reservedForFutureUse # reserved
513        self.tags[0xf2] = self.reservedForFutureUse # reserved
514        self.tags[0xf3] = self.reservedForFutureUse # reserved
515        self.tags[0xf4] = self.reservedForFutureUse # reserved
516        self.tags[0xf5] = self.reservedForFutureUse # reserved
517        self.tags[0xf6] = self.reservedForFutureUse # reserved
518        self.tags[0xf7] = self.reservedForFutureUse # reserved
519       
[193]520        self.tags[0xf8] = 1 # attr_ubyte
521        self.tags[0xf9] = 2 # attr_uint16
522       
523        self.tags[0xfa] = self.embeddedData      # dataLength
524        self.tags[0xfb] = self.embeddedDataSmall # dataLengthByte
[245]525       
526        self.tags[0xfc] = self.reservedForFutureUse # reserved
527        self.tags[0xfd] = self.reservedForFutureUse # reserved
528        self.tags[0xfe] = self.reservedForFutureUse # reserved
529        self.tags[0xff] = self.reservedForFutureUse # reserved
[193]530           
[206]531        # color spaces   
532        self.BWColorSpace = "".join([chr(0x00), chr(0xf8), chr(0x03)])
533        self.GrayColorSpace = "".join([chr(0x01), chr(0xf8), chr(0x03)])
534        self.RGBColorSpace = "".join([chr(0x02), chr(0xf8), chr(0x03)])
535       
536        # set number of copies
537        self.setNumberOfCopies = "".join([chr(0xf8), chr(0x31)]) 
538       
[193]539        infileno = self.infile.fileno()
[258]540        self.pages = { 0 : { "copies" : 1, 
541                             "orientation" : "Default", 
542                             "mediatype" : "Plain", 
543                             "mediasize" : "Default", 
544                             "mediasource" : "Default", 
[299]545                             "duplex" : None,
[258]546                           } 
547                     }     
[193]548        self.minfile = minfile = mmap.mmap(infileno, os.fstat(infileno)[6], prot=mmap.PROT_READ, flags=mmap.MAP_SHARED)
549        tags = self.tags
550        self.pagecount = 0
[314]551        self.escapedStuff = {}   # For escaped datas, mostly PJL commands
552        self.prescribeStuff = {} # For Kyocera Prescribe commands
[316]553        pos = oldpos = 0
[193]554        try :
[307]555            try :
556                while 1 :
557                    try :
[316]558                        tag = ord(minfile[pos])
[307]559                    except OverflowError :   
560                        pos = oldpos + 1
561                    pos += 1
[316]562                    length = tags[tag]
[307]563                    if length :
564                        if callable(length) :   
[316]565                            length = length(pos)
[307]566                        oldpos = pos   
567                        pos += length   
568            except IndexError : # EOF ?           
569                pass
570        finally :
571            self.minfile.close()
[193]572           
573        # now handle number of copies for each page (may differ).
[206]574        if self.iscolor :
575            colormode = "Color"
576        else :   
[253]577            colormode = "BW"
[252]578           
[253]579        defaultduplexmode = "Simplex"
580        defaultpapersize = ""
[252]581        defaultpjlcopies = 1   
582        oldpjlcopies = -1
[253]583        oldduplexmode = ""
584        oldpapersize = ""
[193]585        for pnum in range(1, self.pagecount + 1) :
586            # if no number of copies defined, take 1, as explained
587            # in PCLXL documentation.
588            # NB : is number of copies is 0, the page won't be output
589            # but the formula below is still correct : we want
590            # to decrease the total number of pages in this case.
[299]591            page = self.pages.get(pnum, self.pages.get(1, { "copies" : 1, "mediasize" : "Default", "duplex" : None }))
[266]592            pjlstuff = self.escapedStuff.get(pnum, self.escapedStuff.get(0, []))
[252]593            if pjlstuff :
594                pjlparser = pjl.PJLParser("".join(pjlstuff))
595                nbdefaultcopies = int(pjlparser.default_variables.get("COPIES", -1))
596                nbcopies = int(pjlparser.environment_variables.get("COPIES", -1))
597                nbdefaultqty = int(pjlparser.default_variables.get("QTY", -1))
598                nbqty = int(pjlparser.environment_variables.get("QTY", -1))
599                if nbdefaultcopies > -1 :
600                    defaultpjlcopies = nbdefaultcopies
601                if nbdefaultqty > -1 :
602                    defaultpjlcopies = nbdefaultqty
603                if nbcopies > -1 :
[253]604                    pjlcopies = nbcopies
[252]605                elif nbqty > -1 :
[253]606                    pjlcopies = nbqty
[252]607                else :
608                    if oldpjlcopies == -1 :   
[253]609                        pjlcopies = defaultpjlcopies
610                    else :   
611                        pjlcopies = oldpjlcopies   
[299]612                if page["duplex"] :       
613                    duplexmode = page["duplex"]
614                else :   
615                    defaultdm = pjlparser.default_variables.get("DUPLEX", "")
616                    if defaultdm :
617                        if defaultdm.upper() == "ON" :
618                            defaultduplexmode = "Duplex"
619                        else :   
620                            defaultduplexmode = "Simplex"
621                    envdm = pjlparser.environment_variables.get("DUPLEX", "")
622                    if envdm :
623                        if envdm.upper() == "ON" :
624                            duplexmode = "Duplex"
625                        else :   
626                            duplexmode = "Simplex"
627                    else :       
628                        if not oldduplexmode :
629                            duplexmode = defaultduplexmode
630                        else :   
631                            duplexmode = oldduplexmode
[253]632                defaultps = pjlparser.default_variables.get("PAPER", "")
633                if defaultps :
634                    defaultpapersize = defaultps
635                envps = pjlparser.environment_variables.get("PAPER", "")
636                if envps :
637                    papersize = envps
638                else :   
639                    if not oldpapersize :
640                        papersize = defaultpapersize
641                    else :   
642                        papersize = oldpapersize
[252]643            else :       
644                if oldpjlcopies == -1 :
645                    pjlcopies = defaultpjlcopies
646                else :   
647                    pjlcopies = oldpjlcopies
[253]648                if not oldduplexmode :
649                    duplexmode = defaultduplexmode
650                else :   
651                    duplexmode = oldduplexmode
652                if not oldpapersize :   
653                    papersize = defaultpapersize
654                else :   
655                    papersize = oldpapersize
656                duplexmode = oldduplexmode
657                papersize = oldpapersize or page["mediasize"]
658            if page["mediasize"] != "Default" :
659                papersize = page["mediasize"]
660            if not duplexmode :   
661                duplexmode = oldduplexmode or defaultduplexmode
662            oldpjlcopies = pjlcopies   
663            oldduplexmode = duplexmode
664            oldpapersize = papersize
[252]665            copies = pjlcopies * page["copies"]
[193]666            self.pagecount += (copies - 1)
[253]667            self.logdebug("%s*%s*%s*%s*%s*%s*%s" % (copies, 
[252]668                                                 page["mediatype"], 
[253]669                                                 papersize, 
[252]670                                                 page["orientation"], 
671                                                 page["mediasource"], 
[253]672                                                 duplexmode, 
[252]673                                                 colormode))
[193]674        return self.pagecount
675       
676def test() :       
677    """Test function."""
[196]678    if (len(sys.argv) < 2) or ((not sys.stdin.isatty()) and ("-" not in sys.argv[1:])) :
679        sys.argv.append("-")
680    totalsize = 0   
681    for arg in sys.argv[1:] :
682        if arg == "-" :
683            infile = sys.stdin
684            mustclose = 0
685        else :   
686            infile = open(arg, "rb")
687            mustclose = 1
688        try :
[220]689            parser = Parser(infile, debug=1)
[196]690            totalsize += parser.getJobSize()
[200]691        except pdlparser.PDLParserError, msg :   
[196]692            sys.stderr.write("ERROR: %s\n" % msg)
693            sys.stderr.flush()
694        if mustclose :   
695            infile.close()
696    print "%s" % totalsize
[193]697   
698if __name__ == "__main__" :   
699    test()
Note: See TracBrowser for help on using the browser.