<div dir="ltr"><div>Dear AS List,</div><div><br></div><div>We rely on the OAI feed to pipe updated records to various places, on a nightly basis.  We recently came across some odd behavior that we are hoping list members might have some suggestions. <br></div><div><br></div><div>We have a few resource records that have been recently updated, show the correct updated time in the staff GUI, and have the correct updated time when the downloaded directly using the OAI getRecord command[1].</div><div><br></div><div>However, in our bulk OAI download of all records, using pyoaiharvester[2], the record's datestamp is somehow stuck on an earlier date.  <br></div><div><br></div><div>Even stranger, if we add the 'from' parameter to [2] manually with the correct date value, we *get* the records, with the correct datestamp.  <br></div><div><br></div><div>We are digging into this with help from Lyrasis, but we don't have an answer yet.  My guess is an issue with the harvester, but it's not immediately obvious what it would be.  Other avenues we're looking at issues with the resumption token, or with the indexer (the latter often being the cause of AS issues, anecdotally). Questions for the list:</div><div><br></div><div>1) Is there anything known in the OAI implementation that might cause this off datestamp behavior? <br></div><div><br></div><div>2) Since this may be an issue with the harvester, does anyone have a preferred OAI harvester that handles marcxml?  </div><div><br></div><div>Best,</div><div><br></div><div>Kevin<br></div><div><br></div><div>[1] getRecord command; getting it as a single record has the right datestamp:<br>https://{oaiendpoint}?verb=GetRecord&identifier=oai:columbia//repositories/2/resources/6381&metadataPrefix=oai_marc</div><div><br></div><div>[2] Using the pyoaiharvester library (<a href="https://github.com/vphill/pyoaiharvester" target="_blank">https://github.com/vphill/pyoaiharvester</a>). <br>python /.../as_reports/pyoaiharvester/pyoaiharvest.py -l 
{oaiendpoint}

 -m oai_marc -s collection -o /.../archivesspace/oai/20200419.asRaw.xml</div><div><br></div><div>-- <br><div dir="ltr" data-smartmail="gmail_signature">Kevin Schlottmann<br>Head of Archives Processing<br>Rare Book & Manuscript Library<br>Butler Library, Room 801<br>Columbia University<br>535 W. 114th St., New York, NY  10027<br>(212) 854-8483</div></div></div>