<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:10.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="blue" vlink="purple" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Hi Andy,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Try set=collection, with no “s”.  I think that’s your problem.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Brian<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal" style="margin-bottom:12.0pt"><b><span style="font-size:12.0pt;color:black">From:
</span></b><span style="font-size:12.0pt;color:black">archivesspace_users_group-bounces@lyralists.lyrasis.org <archivesspace_users_group-bounces@lyralists.lyrasis.org> on behalf of Andy Boze <Boze.1@nd.edu><br>
<b>Date: </b>Friday, March 10, 2023 at 2:45 PM<br>
<b>To: </b>Archivesspace Users Group <archivesspace_users_group@lyralists.lyrasis.org><br>
<b>Subject: </b>[Archivesspace_Users_Group] Question about OAI harvest of MARCXML records<o:p></o:p></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:11.0pt">Hi, all.<br>
<br>
Before I get to the question, let me give some background. We've been <br>
successfully harvesting EAD records from ASpace. We're currently running <br>
v2.8.1 and when we test the harvest on v3.3 we consistently get timeout <br>
problems where sometimes ASpace will simply stop responding or return <br>
some error. Some of our records are very large, but this happens when we <br>
request even relatively small records.<br>
<br>
As a work-around, we wanted to try harvesting records in MARCXML format. <br>
It doesn't provide all of the data that are included in the EAD record, <br>
but it's good enough for our purposes.<br>
<br>
The problem we have with harvesting records in MARCXML format is that <br>
ASpace returns not only resource records (which are the only records <br>
returned by EAD) but also records for archival objects, which we don't <br>
want. That is, we want records with an identifier of<br>
<br>
<identifier>oai:und//repositories/2/resources/1301</identifier><br>
<br>
but not<br>
<br>
<identifier>oai:und//repositories/2/archival_objects/673199</identifier><br>
<br>
When I add set=fonds to the OAI URL, I do get just resources (plus <br>
deleted records), which is pretty much what I would expect, but not all <br>
of our resources are fonds. When I add set=collections, I start getting <br>
archival objects as well as resources. And without specifying a set, I <br>
get a mix of resources and archival objects. (Our harvester also doesn't <br>
allow us to request specific records, just a set and a beginning/ending <br>
date.)<br>
<br>
So, my question is: Is there a way to harvest MARCXML records only for <br>
resources?<br>
<br>
I hope this makes sense. I've not an archivist, so I hope I'm stating <br>
things adequately.<br>
<br>
Andy<br>
<br>
-- <br>
Andy Boze, Associate Librarian<br>
University of Notre Dame<br>
271H Hesburgh Library<br>
(574) 631-8708<br>
_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
Archivesspace_Users_Group@lyralists.lyrasis.org<br>
<a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</a><o:p></o:p></span></p>
</div>
</div>
</body>
</html>